- 第一步实现自己的文件搜索系统:通过指定接口上传,到服务器,文件的
各种元信息通过tika提取出来,内容也提取出来,分类,音频,视频,图片,文字,
然后,音频,视频,转为音频在语音识别为文字,图片通过ocr识别为文字,就可以全文检索了,同时支持分类搜索 - 对已有的文件,通过fscrwaler+tika爬取信息,同上
- 对于动态的日志文件什么的 事件文件什么的,通过elk + filebeat+一系列搜集工具实现导入es
- 全文检索参考ambar,https://ambar.cloud/,fscrawer的实现,tika的实现
- 后期数据量大了,肯定要上hadoop+es,es+tika,spring cloud,后期肯定要上,flutter,
- 多终端,微信小程序,pc,web,安卓,ios,linux,mac
- 生态,博客,论坛,社区,都搞起来,社群,聊天
- 人工智能,推荐,深度学习
- 追求效率,c++
- 架构,设计模式,算法,集大成
- 发掘需求,写作需求成就了知乎,搜索需求百度,社交,腾讯,购物,阿里,音乐,网易,github:分(chao)享)(xi)
- 卧槽,搜狗输入法和 hexo admin 中英文切换有点不兼容
关于AISearch搜索引擎的想法
最后更新时间:
这里可以写作者留言,标签和 hexo 中所有变量及辅助函数等均可调用,示例:https://quietclickcode.github.io/2020/01/06/%E5%85%B3%E4%BA%8EAISearch%E6%90%9C%E7%B4%A2%E5%BC%95%E6%93%8E%E7%9A%84%E6%83%B3%E6%B3%95/