💡 要旨: 解析したいログがでかかったときのTips
クラウドなどのサーバーなどにバカでかいログファイルなどがあって、その場で読むだけでは済まなくてダウンロードしたいけど、あまりに大きすぎてそのままやると数時間~数日かかりそう。
- zip化してダウンロード
がファーストチョイスだが、zip化するのも困難なレベルで時間がかかる場合、sedとかでスキャンするのを考えるのもちょっと面倒/時間がかかりそうな場合。
- 必要そうな場所を大雑把に切り出すと圧倒的に早くなる。
linuxでその際のコマンドには spritが使えた。
bash
split -n 1000/1000 分割したいファイル.txt > out.txt
「-n 欲しい部位/分割数」のオプションはファイルを書き出さずに標準出力にだけ出すので、それをリダイレクトして書き出せば計算時間も最小だしサーバーのHDDにゴミファイルも作らなくて済む。
https://atmarkit.itmedia.co.jp/ait/articles/1711/24/news016.html