memvid 基于视频的 AI 内存库。通过闪电般的语义搜索将数百万个文本块存储在 MP4 文件中-开源码库社区-开源分享-6协议-村兔网

memvid 基于视频的 AI 内存库。通过闪电般的语义搜索将数百万个文本块存储在 MP4 文件中

v2 中会发生什么

抢先体验通知
Memvid v1 仍处于实验阶段。文件格式和 API 可能会发生变化,直到我们锁定稳定版本。

Memvid v2 – 下一步是什么

  • 生活记忆引擎 – 不断添加新数据,让法学硕士在会话中记住它。
  • 胶囊上下文 – 可共享的胶囊,每个胶囊都有自己的规则和有效期。.mv2
  • 时间旅行调试 – 倒带或分支任何聊天以进行审查或测试。
  • 智能调用 – 本地缓存会猜测您需要什么并在 5 毫秒内加载它。
  • 编解码器智能 – 现在自动调整 AV1 并稍后自动调整未来的编解码器,因此文件不断缩小。
  • CLI 和仪表板 – 用于分支、分析和单命令云发布的简单工具。

Memvid v2 的先睹为快 – 一个活生生的记忆引擎,可用于与您的知识库聊天。Memvid v2 预览版


Memvid v1

Memvid – 将数百万个文本块转换为单个可搜索的视频文件

Memvid 将整个知识库压缩为 MP4 文件,同时保持毫秒级语义搜索。将其视为 SQLite,用于 AI 内存便携、高效且独立。通过在视频帧中将文本编码为 QR 码,我们提供的存储空间比零基础设施的矢量数据库小 50-100×


为什么视频压缩改变了一切 🚀

它能实现什么 视频编解码器如何实现
存储空间小 50-100× 现代视频编解码器对重复视觉模式(二维码)的压缩效果远胜于原始嵌入
低于 100 毫秒的检索 通过索引→二维码直接寻帧→您的文本。无服务器往返
零基础设施 只有 Python 和 MP4 文件 – 没有数据库集群,没有 Docker,没有作
真正的便携性 复制或流式传输 – 它适用于视频播放的任何地方memory.mp4
离线优先设计 编码后,一切都在没有互联网的情况下运行

引擎盖下 – Memvid v1 🔍

  1. 文本→ QR →帧
    每个文本块都变成一个 QR 码,打包到视频帧中。现代编解码器擅长压缩这些重复模式。

  2. 智能索引
    嵌入映射查询→帧号。一个搜索,一个解码,毫秒级的结果。

  3. 编解码器利用
    30 年的视频研发经验,这意味着您的文本压缩得比任何自定义算法都好。

  4. 面向
    未来的下一代编解码器(AV1、H.266)可自动使您的内存更小、更快——无需更改代码。


安装

pip install memvid
# For PDF support
pip install memvid PyPDF2

快速入门

from memvid import MemvidEncoder, MemvidChat

# Create video memory from text
chunks = ["NASA founded 1958", "Apollo 11 landed 1969", "ISS launched 1998"]
encoder = MemvidEncoder()
encoder.add_chunks(chunks)
encoder.build_video("space.mp4", "space_index.json")

# Chat with your memory
chat = MemvidChat("space.mp4", "space_index.json")
response = chat.chat("When did humans land on the moon?")
print(response)  # References Apollo 11 in 1969

真实世界的例子

文档助手

from memvid import MemvidEncoder
import os

encoder = MemvidEncoder(chunk_size=512)

# Index all markdown files
for file in os.listdir("docs"):
    if file.endswith(".md"):
        with open(f"docs/{file}") as f:
            encoder.add_text(f.read(), metadata={"file": file})

encoder.build_video("docs.mp4", "docs_index.json")

PDF 库搜索

# Index multiple PDFs
encoder = MemvidEncoder()
encoder.add_pdf("deep_learning.pdf")
encoder.add_pdf("machine_learning.pdf") 
encoder.build_video("ml_library.mp4", "ml_index.json")

# Semantic search across all books
from memvid import MemvidRetriever
retriever = MemvidRetriever("ml_library.mp4", "ml_index.json")
results = retriever.search("backpropagation", top_k=5)

交互式 Web UI

from memvid import MemvidInteractive

# Launch at http://localhost:7860
interactive = MemvidInteractive("knowledge.mp4", "index.json")
interactive.run()

高级功能

规模优化

# Maximum compression for huge datasets
encoder.build_video(
    "compressed.mp4",
    "index.json", 
    fps=60,              # More frames/second
    frame_size=256,      # Smaller QR codes
    video_codec='h265',  # Better compression
    crf=28              # Quality tradeoff
)

自定义嵌入

from sentence_transformers import SentenceTransformer

model = SentenceTransformer('all-mpnet-base-v2')
encoder = MemvidEncoder(embedding_model=model)

并行处理

 

encoder = MemvidEncoder(n_workers=8)
encoder.add_chunks_parallel(million_chunks)

CLI 用法

# Process documents
python examples/file_chat.py --input-dir /docs --provider openai

# Advanced codecs
python examples/file_chat.py --files doc.pdf --codec h265

# Load existing
python examples/file_chat.py --load-existing output/memory

性能

  • 索引:现代 CPU 上 ~10K 块/秒
  • 搜索:1M 块 <100ms(包括解码)
  • 存储:100MB 文本→ 1-2MB 视频
  • 内存:恒定 500MB RAM,无论大小如何

v2 中即将推出的内容

  • Delta 编码:通过知识版本进行时间旅行
  • 流式摄取:实时添加到视频中
  • 云仪表板:具有 API 管理的 Web UI
  • 智能编解码器:自动选择每个内容的 AV1/HEVC
  • GPU 提升:批量编码速度提高 100×

     

请登录后发表评论

    没有回复内容