郝彦飞 Bunny-VisionPro:用于模仿学习的实时双手灵巧遥操作 Bunny-VisionPro is a real-time bimanual teleoperation system that prioritizes safety and minimal delay. It also features human haptic feedback to enhance immersion. High-quality demonstration is colle... AI场景 开源 机器人
郝彦飞 AFFiNE:一款媲美Notion的开源知识库APP,写写画画做计划,都支持! AFFiNE 是一个开源的多合一工作区和操作系统,用于组装你的知识库的所有构建块以及更多内,包括wiki、知识库、演示和数字资产等。它是一个可以对表 Notion 和 Miro 的替代品。AFFiNE是一个跨平台友好的项目,现已支持Windows、Mac和Linux系统,并可以基于Docker自托管。 源码地址: https://github.com/toeverything/AFFiNE 官网地... 开源 效率工具 笔记
郝彦飞 FunAudioLLM:阿里通义音频生成开源大模型 CosyVoice 致力于自然语音生成,支持多语言、音色和情感控制,在多语言语音生成、零样本语音生成、跨语言声音合成和指令执行能力方面表现卓越。 多语言合成:采用了总共超15万小时的数据训练,支持中英日粤韩5种语言的合成,合成效果显著优于传统语音合成模型。 极速音色模拟:仅需要3~10s的原始音频,即可生成模拟音色,甚至包括韵律、情感等细节。在跨语种的语音合成中,也有不俗的表现。 富文本或自然语言... AI语音 底层工具 开源
郝彦飞 4M: 提供图像分类、目标检测、语义分割、实例分割、深度估计、表面法线估计等数十种功能 A framework for training any-to-any multimodal foundation models. 用于训练任意多模式基础模型的框架。 Scalable. Open-sourced. Across tens of modalities and tasks. 可扩展。开源。跨越数十种模式和任务。 Demo地址: https://huggingface.co/space... 大模型学习 开源 视觉模型
郝彦飞 Quivr:用于构建 GenAI Second Brains 的开源 RAG 框架 Key Features 🎯 主要特点🎯 Fast and Efficient : Designed with speed and efficiency at its core. Quivr ensures rapid access to your data. 快速高效:设计以速度和效率为核心。 Quivr 确保快速访问您的数据。 Secure : Your data, your control.... RAG 底层工具 开源
郝彦飞 fish-speech:Brand new TTS solution Fish Speech:人人都可克隆声音且带情感的开源AI语音模型,该TTS模型与chat-tts、seed-tts同一级别,且支持自定义训练,支持本地化部署 官网: https://speech.fish.audio/ 源码地址: https://github.com/fishaudio/fish-speech... AI语音 开源
郝彦飞 Dataherald:Text-to-SQL 引擎 Dataherald is a natural language-to-SQL engine built for enterprise-level question answering over relational data. It allows you to set up an API from your database that can answer questions in plain ... text2sql 底层工具 开源
郝彦飞 Gorilla:用大模型调用1600个API,AGI时代真的来了 Gorilla是一个为大型语言模型设计的API商店,支持通过自然语言查询调用API,实现语义和语法正确的API调用。它通过整合超过1600个API,首次展示了使用LLM调用API的方法,有效减少了生成假象的问题。此外,Gorilla还发布了APIBench,这是一个庞大的、经过策划且易于训练的API集合。 Gorilla是一个基于 LLaMA 的微调模型,在编写 API 调用方面超越了 GPT-4... 底层工具 开源
郝彦飞 OmniParse:清洗非结构化的数据,提升RAG质量 OmniParse is a platform that ingests/parses any unstructured data into structured, actionable data optimized for GenAI (LLM) applcaitons. Whether working with documents, tables, images, videos, audio ... 底层工具 开源 数据处理
郝彦飞 wiseflow:信息挖掘 AI 神器,省时高效 首席情报官 (Wiseflow)是一个敏捷的信息挖掘工具,可以从网站、微信公众号、社交平台等各种信息源中按设定的关注点提炼讯息,自动做标签归类并上传数据库。 功能特色 🚀 原生 LLM 应用 我们精心选择了最适合的 7B~9B 开源模型,最大化降低使用成本,且利于数据敏感用户随时完全切换至本地部署。 🌱 轻量化设计 不用任何向量模型,系统开销很小,无需 GPU,适合任何硬件环境。 🗃️ 智能信息提... 信息挖掘 底层工具 开源
郝彦飞 WebDesignAgent:网页生成An agent used for webdesign WebDesignAgnet is an autonomous agent that can help you build a series of websites. WebDesignAgnet 是一个自主代理,可以帮助您构建一系列网站。 It supports building webpages with: 它支持通过以下方式构建网页: Text → Website : Transform y... 开源 效率工具 网页生成
郝彦飞 webots:开源机器人模拟器 机器人模拟器是一种计算机程序,用于模拟和测试机器人的行为和性能。 它为研究人员、开发者和工程师提供了一个虚拟环境,可以在不影响真实机器人硬件的情况下进行算法验证、程序开发和行为测试。以下是机器人模拟器的一些主要用途: 1. 设计和开发: 在机器人模拟器中,开发者可以为机器人创建数字模型,并编写控制算法。这允许他们在将实体的机器人制造出来之前,先测试和优化其设计和行为。 2. 教育与培训: 模拟器提... 开源 机器人