v2 中会发生什么
抢先体验通知
Memvid v1 仍处于实验阶段。文件格式和 API 可能会发生变化,直到我们锁定稳定版本。Memvid v2 – 下一步是什么
- 生活记忆引擎 – 不断添加新数据,让法学硕士在会话中记住它。
- 胶囊上下文 – 可共享的胶囊,每个胶囊都有自己的规则和有效期。
.mv2- 时间旅行调试 – 倒带或分支任何聊天以进行审查或测试。
- 智能调用 – 本地缓存会猜测您需要什么并在 5 毫秒内加载它。
- 编解码器智能 – 现在自动调整 AV1 并稍后自动调整未来的编解码器,因此文件不断缩小。
- CLI 和仪表板 – 用于分支、分析和单命令云发布的简单工具。
Memvid v2 的先睹为快 – 一个活生生的记忆引擎,可用于与您的知识库聊天。
Memvid v1
Memvid – 将数百万个文本块转换为单个可搜索的视频文件
Memvid 将整个知识库压缩为 MP4 文件,同时保持毫秒级语义搜索。将其视为 SQLite,用于 AI 内存便携、高效且独立。通过在视频帧中将文本编码为 QR 码,我们提供的存储空间比零基础设施的矢量数据库小 50-100×。
为什么视频压缩改变了一切 🚀
| 它能实现什么 | 视频编解码器如何实现 |
|---|---|
| 存储空间小 50-100× | 现代视频编解码器对重复视觉模式(二维码)的压缩效果远胜于原始嵌入 |
| 低于 100 毫秒的检索 | 通过索引→二维码直接寻帧→您的文本。无服务器往返 |
| 零基础设施 | 只有 Python 和 MP4 文件 – 没有数据库集群,没有 Docker,没有作 |
| 真正的便携性 | 复制或流式传输 – 它适用于视频播放的任何地方memory.mp4 |
| 离线优先设计 | 编码后,一切都在没有互联网的情况下运行 |
引擎盖下 – Memvid v1 🔍
-
文本→ QR →帧
每个文本块都变成一个 QR 码,打包到视频帧中。现代编解码器擅长压缩这些重复模式。 -
智能索引
嵌入映射查询→帧号。一个搜索,一个解码,毫秒级的结果。 -
编解码器利用
30 年的视频研发经验,这意味着您的文本压缩得比任何自定义算法都好。 -
面向
未来的下一代编解码器(AV1、H.266)可自动使您的内存更小、更快——无需更改代码。
安装
pip install memvid
# For PDF support
pip install memvid PyPDF2
快速入门
from memvid import MemvidEncoder, MemvidChat
# Create video memory from text
chunks = ["NASA founded 1958", "Apollo 11 landed 1969", "ISS launched 1998"]
encoder = MemvidEncoder()
encoder.add_chunks(chunks)
encoder.build_video("space.mp4", "space_index.json")
# Chat with your memory
chat = MemvidChat("space.mp4", "space_index.json")
response = chat.chat("When did humans land on the moon?")
print(response) # References Apollo 11 in 1969
真实世界的例子
文档助手
from memvid import MemvidEncoder
import os
encoder = MemvidEncoder(chunk_size=512)
# Index all markdown files
for file in os.listdir("docs"):
if file.endswith(".md"):
with open(f"docs/{file}") as f:
encoder.add_text(f.read(), metadata={"file": file})
encoder.build_video("docs.mp4", "docs_index.json")
PDF 库搜索
# Index multiple PDFs
encoder = MemvidEncoder()
encoder.add_pdf("deep_learning.pdf")
encoder.add_pdf("machine_learning.pdf")
encoder.build_video("ml_library.mp4", "ml_index.json")
# Semantic search across all books
from memvid import MemvidRetriever
retriever = MemvidRetriever("ml_library.mp4", "ml_index.json")
results = retriever.search("backpropagation", top_k=5)
交互式 Web UI
from memvid import MemvidInteractive
# Launch at http://localhost:7860
interactive = MemvidInteractive("knowledge.mp4", "index.json")
interactive.run()
高级功能
规模优化
# Maximum compression for huge datasets
encoder.build_video(
"compressed.mp4",
"index.json",
fps=60, # More frames/second
frame_size=256, # Smaller QR codes
video_codec='h265', # Better compression
crf=28 # Quality tradeoff
)
自定义嵌入
from sentence_transformers import SentenceTransformer
model = SentenceTransformer('all-mpnet-base-v2')
encoder = MemvidEncoder(embedding_model=model)
并行处理
encoder = MemvidEncoder(n_workers=8)
encoder.add_chunks_parallel(million_chunks)
CLI 用法
# Process documents
python examples/file_chat.py --input-dir /docs --provider openai
# Advanced codecs
python examples/file_chat.py --files doc.pdf --codec h265
# Load existing
python examples/file_chat.py --load-existing output/memory
性能
- 索引:现代 CPU 上 ~10K 块/秒
- 搜索:1M 块 <100ms(包括解码)
- 存储:100MB 文本→ 1-2MB 视频
- 内存:恒定 500MB RAM,无论大小如何
v2 中即将推出的内容
- Delta 编码:通过知识版本进行时间旅行
- 流式摄取:实时添加到视频中
- 云仪表板:具有 API 管理的 Web UI
- 智能编解码器:自动选择每个内容的 AV1/HEVC
- GPU 提升:批量编码速度提高 100×


没有回复内容