久しぶりのプログラミング
「松本人志の放送室」というラジオが2001年から2009年までやっていた。CD化もされている。そのラジオでは昭和の名曲がよくかかるのだが、どんな曲かかっていたのかを知りたくなった。
http://www.hisakawa.net/hososhitsu/
ここで、そのラジオの内容を書き起こしてくれている人がいる。そして挿入歌もちゃんと記録されている。HTMLもきちんとマークアップされており、挿入歌表示用タグのCSSクラスを定義している。
何度もリンクをクリックして見て行くのもアレなので、プログラム的に取得することにした。
使い捨てなのでザツなプログラムである。
#!/usr/bin/perl use strict; use warnings; use LWP::UserAgent; use Encode; my $ua = LWP::UserAgent->new; $ua->timeout(100); $ua->agent('Mozilla'); foreach my $i (1 .. 37) { my $url = sprintf("http://www.hisakawa.net/hososhitsu/r_digest_%02d.html", $i); my $req = HTTP::Request->new(GET => $url); my $res = $ua->request($req); if ($res->is_success) { my @lines = split("\n", $res->content); my $date = ""; foreach my $line ( @lines ) { if ($line =~ /ymd/g) { no warnings; $line =~ s/<.*?>//gs; $date = decode("shiftjis", $line); } if ($line =~ /sng/g) { no warnings; $line =~ s/<.*?>//gs; print $date . " " . substr( decode("shiftjis", $line), 3 ) . "\n"; } } } sleep 1; } __END__