资源说明:IM日志处理
在过去三年中,我已经备份了所有IM日志。 当时,我真的不知道为什么。 我以为也许有一天我想再读一遍。 好吧,我的日志现在有150Mb,我可能很快就不会读完它。
但是今年我做了两门有关Coursera的课程,即机器学习和自然语言处理,这让我开始思考。 也许我可以构建一些工具来帮助我分析日志并从中处理一些有意义的信息。 那是什么信息? 我还不知道但这是一项正在进行的工作。
路线图
处理各种IM程序的日志
处理Digsby日志
处理Trillian日志
处理Pidgin日志
处理Whatsapp电子邮件聊天
处理Facebook外卖数据
处理环聊外卖数据
尽可能高效地存储日志
根据最流行的联系方式制作漂亮的图表
最常见的单词
找出我的联系人中的群集
超越无限
使用说明
来自外卖数据的Facebook消息应该美化。 这样,HTML输出将更加一致,并且更易于解析。
项目组织
├── LICENSE
├── Makefile <- Makefile with commands like `make data` or `make train`
├── README
本源码包内暂不包含可直接显示的源代码文件,请下载源码包。
English
