久しぶりのプログラミング

松本人志の放送室」というラジオが2001年から2009年までやっていた。CD化もされている。そのラジオでは昭和の名曲がよくかかるのだが、どんな曲かかっていたのかを知りたくなった。

http://www.hisakawa.net/hososhitsu/

ここで、そのラジオの内容を書き起こしてくれている人がいる。そして挿入歌もちゃんと記録されている。HTMLもきちんとマークアップされており、挿入歌表示用タグのCSSクラスを定義している。

何度もリンクをクリックして見て行くのもアレなので、プログラム的に取得することにした。
使い捨てなのでザツなプログラムである。

#!/usr/bin/perl

use strict;
use warnings;
use LWP::UserAgent;

use Encode;

my $ua = LWP::UserAgent->new;

$ua->timeout(100);
$ua->agent('Mozilla');

foreach my $i (1 .. 37) {

    my $url = sprintf("http://www.hisakawa.net/hososhitsu/r_digest_%02d.html", $i);
    my $req = HTTP::Request->new(GET => $url);

    my $res = $ua->request($req);

    if ($res->is_success) {
        my @lines = split("\n", $res->content);

        my $date = "";

        foreach my $line ( @lines ) {
            if ($line =~ /ymd/g) {
                no warnings;
                $line =~ s/<.*?>//gs;
                $date =  decode("shiftjis", $line);
            }
            if ($line =~ /sng/g) {
                no warnings;
                $line =~ s/<.*?>//gs;
                print $date . " " . substr( decode("shiftjis", $line), 3 ) . "\n";
            }
        }
    }
    sleep 1;
}

__END__