
VLMでメディアを管理する
セルフホスト型メディアマネージャー
Generative Media Manager : GeMM
動画・画像・PDF・Word・ExcelをVLMで解析し、自然言語で横断検索。検索結果を視覚的に提示し、ハルシネーションを回避。完全セルフホスト。機密データを外部に送信しません。
お問い合わせGeMM SaaS(準備中)
特徴
主な特徴
柔軟なアーキテクチャ
Docker Composeで自社環境にデプロイ。ローカルVLMで処理しつつ、必要に応じてクラウドLLMと連携。完全オンプレミス運用も可能。
マルチモーダルRAG
動画・画像・文書を統一的にベクトル化し、自然言語で横断検索。検索結果は視覚的に提示され、ハルシネーションを回避できます。
高速ベクトル検索
PostgreSQL + pgvectorでHNSWインデックスによる高速ANN検索。数百万ベクトルでもミリ秒レスポンス。既存のSQLワークフローとも統合可能。
多様な連携方法
Web UI、MCP対応AIエージェント連携(Claude Desktop / Cursor)、REST APIによる社内システム連携が可能。
活用シーン
様々なシーンで活用できます
Web UIによる社内ナレッジ検索
会議動画、マニュアル動画、研修資料を自然言語で横断検索。「先月の経営会議で売上について話した箇所」のような曖昧なクエリにも対応。動画内のシーンを直接検索し、タイムスタンプ付きで結果を表示。
MCP対応AIエージェント連携
MCPサーバーとしてAIエージェントと接続。RAGのRetriever部分をGeMMに任せて、マルチモーダルな知識ベースを簡単に構築。Claude Desktop / Cursorとの統合に対応。
REST APIによる社内システム連携
製造ラインの監視映像や検査画像を解析。異常検知や過去事例との類似検索で、品質管理の効率化とトレーサビリティを実現。