開発
いよいよ年末
murakami
こんにちは、いよいよ2013年も終わりに近づいて参りましたがいかがお過ごしでしょうか?会津は去年・一昨年のこの時期と比べるととても雪が少ない気がします。
さてさて、年末ということで大掃除やら何やらを始めたのですが今年は去年と一つ新しい対象が追加されました。それはなにか?「ライフログ」です。私自身、そこまでがっつり記録に残しているかというとそうではないかもしれないのですが、一年分のまとめということでしっかりとまとめとこうと思ってやりました。
形態
まず私のログの取り方ですが、 [情報源]* -> [Twitter] という感じでやっています。どうこう言って色々なアプリだったりサービスだったりは「Twitterに投稿する」という便利な機能があるのでこの形態をとっています。
取得
現在、TwitterからログをCSVで取得することが可能なのでそれを用います。便利ですね。
処理
ここからが大きい仕事です。残念ながらTwitterにポストする際にハッシュタグをしっかりジャンルごとにつけていなかったがために、ひたすら正規表現で処理することに・・・(やるならしっかりタグなりつけましょう)
ということでひたすら処理を行ってやっと分けられた情報達、次はそれらをjsonに落としていきます。これに関しては好きな言語でぱぱっとできるので特に問題はありません。またなぜjsonかということですが、後からのメンテのしやすさ等を考慮した上での選択です。
とりあえず csv -> 本文
cat tweets.csv | grep 2013 | awk -F\, '{print $6}' | perl -pe "s/^\"//g;s/\"$//g"
あとはもうひたすら正規表現で どどどどっ と勢いで処理して
{"body":[ {"title":"オープンソースのクアッドコプターラジコン、149 ドルから good read", "url":"http://t.co/PF7KgyVwTT"}, {"title":"Google-API-Client good read", "url":"http://t.co/c4dADT5rPJ"}, {"title":"EddyBorja/MLPSpotlight · GitHub good read", "url":"http://t.co/8EkDqnn"}, {"title":"romaonthego/REDebugClient · GitHub good read", "url":"http://t.co/NeszFx7"}, {"title":"RESTmagic/RESTMagic · GitHub good read", "url":"http://t.co/qWAi8En"} ]}
こんな感じ。あとは煮るなり焼くなり好きな感じで使えるのではないかと思います。
ということで、ライフログとかやってる方は年末の大掃除のついでにでもいいのでログの整理でもしてみては如何でしょうか?
—–
担当 : 村上 (皆様良いお年を)