« レジストリ | トップページ | kakasiの辞書に単語を追加する »

2009-05-19

楽天APIで自動アフィリエイトリンク作成

楽天ウェブサービス商品検索APIを使って、
ブログ記事に自動的にアフィリエイトリンク
作成するツールを作ってみました。

ウェブサービスを利用したリンクはURLが長くなるため、
大量にアフィリエイトリンクを埋め込みすぎると、
文字数制限の10,000バイトを超えてしまいます

そこで出現頻度を指定して、指定の出現頻度以上単語のみをキーワードとして商品検索するようにしました
ちなみに出現頻度は2~5から選択します。デフォルトで2です。

これでも、かなりの数の単語になります。
そこで、1byteのみの文字と2byteでも漢字以外の文字は
除外しました。

これで、対象がかなり熟語のみに絞られました。

次に、2回以上出現するキーワードを全てリンクにしてしまうと、
文字数がかさばるので、初回出現時のみリンクする事にしました。

文章を単語に区切るには、カカシ、チャセン、メカブなどの
形態素解析器で分かち書きします。
はPerlを使ったので、Text::Kakasi.pmを利用しました。

単語単位に切り分けができたら、連想配列のキーとして単語を登録します。
私は出現回数をカウントしているので、連想配列の値には、
ハッシュのリファレンスで、出現回数と商品検索結果のアフィリエイトURLを保存しています。
ここは、配列のリファレンスでもいいと思います。要素0に出現回数、要素1にURLでOKですね。

最終的に、記事の中から単語を検索して、リンク付きの文字列と置換しました。

|

« レジストリ | トップページ | kakasiの辞書に単語を追加する »

Perl」カテゴリの記事

コメント

この記事へのコメントは終了しました。

トラックバック


この記事へのトラックバック一覧です: 楽天APIで自動アフィリエイトリンク作成:

« レジストリ | トップページ | kakasiの辞書に単語を追加する »