memvid 基于视频的 AI 内存库。通过闪电般的语义搜索将数百万个文本块存储在 MP4 文件中

v2 中会发生什么

抢先体验通知
Memvid v1 仍处于实验阶段。文件格式和 API 可能会发生变化，直到我们锁定稳定版本。

Memvid v2 – 下一步是什么

生活记忆引擎 – 不断添加新数据，让法学硕士在会话中记住它。

胶囊上下文 – 可共享的胶囊，每个胶囊都有自己的规则和有效期。.mv2

时间旅行调试 – 倒带或分支任何聊天以进行审查或测试。

智能调用 – 本地缓存会猜测您需要什么并在 5 毫秒内加载它。

编解码器智能 – 现在自动调整 AV1 并稍后自动调整未来的编解码器，因此文件不断缩小。

CLI 和仪表板 – 用于分支、分析和单命令云发布的简单工具。

Memvid v2 的先睹为快 – 一个活生生的记忆引擎，可用于与您的知识库聊天。

Memvid v1

Memvid – 将数百万个文本块转换为单个可搜索的视频文件

Memvid 将整个知识库压缩为 MP4 文件，同时保持毫秒级语义搜索。将其视为 SQLite，用于 AI 内存便携、高效且独立。通过在视频帧中将文本编码为 QR 码，我们提供的存储空间比零基础设施的矢量数据库小 50-100×。

为什么视频压缩改变了一切 🚀

它能实现什么	视频编解码器如何实现
存储空间小 50-100×	现代视频编解码器对重复视觉模式（二维码）的压缩效果远胜于原始嵌入
低于 100 毫秒的检索	通过索引→二维码直接寻帧→您的文本。无服务器往返
零基础设施	只有 Python 和 MP4 文件 – 没有数据库集群，没有 Docker，没有作
真正的便携性	复制或流式传输 – 它适用于视频播放的任何地方`memory.mp4`
离线优先设计	编码后，一切都在没有互联网的情况下运行

引擎盖下 – Memvid v1 🔍

文本→ QR →帧
每个文本块都变成一个 QR 码，打包到视频帧中。现代编解码器擅长压缩这些重复模式。
智能索引
嵌入映射查询→帧号。一个搜索，一个解码，毫秒级的结果。
编解码器利用
30 年的视频研发经验，这意味着您的文本压缩得比任何自定义算法都好。
面向
未来的下一代编解码器（AV1、H.266）可自动使您的内存更小、更快——无需更改代码。

安装

pip install memvid
# For PDF support
pip install memvid PyPDF2

快速入门

from memvid import MemvidEncoder, MemvidChat

# Create video memory from text
chunks = ["NASA founded 1958", "Apollo 11 landed 1969", "ISS launched 1998"]
encoder = MemvidEncoder()
encoder.add_chunks(chunks)
encoder.build_video("space.mp4", "space_index.json")

# Chat with your memory
chat = MemvidChat("space.mp4", "space_index.json")
response = chat.chat("When did humans land on the moon?")
print(response)  # References Apollo 11 in 1969

真实世界的例子

文档助手

from memvid import MemvidEncoder
import os

encoder = MemvidEncoder(chunk_size=512)

# Index all markdown files
for file in os.listdir("docs"):
    if file.endswith(".md"):
        with open(f"docs/{file}") as f:
            encoder.add_text(f.read(), metadata={"file": file})

encoder.build_video("docs.mp4", "docs_index.json")

PDF 库搜索

# Index multiple PDFs
encoder = MemvidEncoder()
encoder.add_pdf("deep_learning.pdf")
encoder.add_pdf("machine_learning.pdf") 
encoder.build_video("ml_library.mp4", "ml_index.json")

# Semantic search across all books
from memvid import MemvidRetriever
retriever = MemvidRetriever("ml_library.mp4", "ml_index.json")
results = retriever.search("backpropagation", top_k=5)

交互式 Web UI

from memvid import MemvidInteractive

# Launch at http://localhost:7860
interactive = MemvidInteractive("knowledge.mp4", "index.json")
interactive.run()

高级功能

规模优化

# Maximum compression for huge datasets
encoder.build_video(
    "compressed.mp4",
    "index.json", 
    fps=60,              # More frames/second
    frame_size=256,      # Smaller QR codes
    video_codec='h265',  # Better compression
    crf=28              # Quality tradeoff
)

自定义嵌入

from sentence_transformers import SentenceTransformer

model = SentenceTransformer('all-mpnet-base-v2')
encoder = MemvidEncoder(embedding_model=model)

并行处理

encoder = MemvidEncoder(n_workers=8)
encoder.add_chunks_parallel(million_chunks)

CLI 用法

# Process documents
python examples/file_chat.py --input-dir /docs --provider openai

# Advanced codecs
python examples/file_chat.py --files doc.pdf --codec h265

# Load existing
python examples/file_chat.py --load-existing output/memory

性能

索引：现代 CPU 上 ~10K 块/秒
搜索：1M 块 <100ms（包括解码）
存储：100MB 文本→ 1-2MB 视频
内存：恒定 500MB RAM，无论大小如何

v2 中即将推出的内容

Delta 编码：通过知识版本进行时间旅行
流式摄取：实时添加到视频中
云仪表板：具有 API 管理的 Web UI
智能编解码器：自动选择每个内容的 AV1/HEVC
GPU 提升：批量编码速度提高 100×

此处内容已隐藏，请评论后刷新页面查看.

评分

欢迎为Ta评分