我要做一件疯狂的事情,将我在 2013-2024 十一年中接近一百个 G 的各种资料(截图、照片、聊天记录、录音、视频等等)全部向量化。
我会把聊天记录和日记调整格式提取信息
把图片全部经过模型进行转义和描述
把音频/视频全部经 whisper 模型转文本
最终将这些资料存储在 cloudflare R2+阿里云盘+Google one 上,并将向量后的结果放到 pinecone
构建一个 know everything about me 的超级 LLM