ふと

 分析サイトを始めてもう半年弱、時間の流れの早さに驚きながらも、ランキングのログファイルが結構な大きさになってきやがりました。もちろん公式のランキングページを丸々残しているわけではなくて、省容量に特化した独自のフォーマットに替えてるけど、それでも30MBほど。最近ではカテゴリ別も入ってきたので、1日あたりのファイル容量の大きさは、カテゴリランキング導入前の約140KBから拡大し、約420KBぐらいになっちゃった。今後は3倍のペースで増えていく見通しですぜ。
 まあレンタルサーバの容量も、一昔前には考えられんぐらい大きくなってるから、平気といえば平気なんだけども、閑話休題、一番怖いのは取得のやり損ね。何しろ最終ランキングは1日に大体1時間弱ぐらいしか確実な取得のチャンスがないため、うっかりオペレートミスをしてしまうと空白ができてしまう。事実、うちでもこれまでに2回ほど、それをやらかしちゃったことがあったと記憶している。一番いいのは取得する主体を複数用意すること、つまりリスクの分散なんだけど、レンタルサーバでやるのはキツイ。なんで、自前のPCで何とかやってるのだけども、複数人でこれをやって、有志でデータを共有するというのも面白そうだと思った。標準化したフォーマットとか決めて、公開すれば、誰でも思いついた面白い分析を手軽に作れもするし、リスクも減るし、ランキング動画などの支援にもなるかもしれない。なんてことを、ふと考えていた早朝9時。

ウイークリーランキングについて

 ウイークリーランキングの計算方法を、前の考察に基づいて、変更しました。
 新しい計算方式は

マイリスト×50+再生+コメント

 です。
 過去に遡って更新しています。

多分解決

 集計用マシンのメモリが足りなかったかなんかで強制終了だった模様。
 アルゴリズムがたいへん突貫工事で、集計になんと2時間ほどかかる現状!!
 各パラメータの順位ソートが問題。やっぱ専門書を1冊も読まずににわか知識だけでプログラミングすると、こうなっちゃう。勉強と本を買う金が必要です。