1. 第一步实现自己的文件搜索系统:通过指定接口上传,到服务器,文件的
    各种元信息通过tika提取出来,内容也提取出来,分类,音频,视频,图片,文字,
    然后,音频,视频,转为音频在语音识别为文字,图片通过ocr识别为文字,就可以全文检索了,同时支持分类搜索
  2. 对已有的文件,通过fscrwaler+tika爬取信息,同上
  3. 对于动态的日志文件什么的 事件文件什么的,通过elk + filebeat+一系列搜集工具实现导入es
  4. 全文检索参考ambar,https://ambar.cloud/,fscrawer的实现,tika的实现
  5. 后期数据量大了,肯定要上hadoop+es,es+tika,spring cloud,后期肯定要上,flutter,
  6. 多终端,微信小程序,pc,web,安卓,ios,linux,mac
  7. 生态,博客,论坛,社区,都搞起来,社群,聊天
  8. 人工智能,推荐,深度学习
  9. 追求效率,c++
  10. 架构,设计模式,算法,集大成
  11. 发掘需求,写作需求成就了知乎,搜索需求百度,社交,腾讯,购物,阿里,音乐,网易,github:分(chao)享)(xi)
  12. 卧槽,搜狗输入法和 hexo admin 中英文切换有点不兼容