AI项目 | 新优态AI

27 文章

开源 ×

Bunny-VisionPro：用于模仿学习的实时双手灵巧遥操作

Bunny-VisionPro：用于模仿学习的实时双手灵巧遥操作

Bunny-VisionPro is a real-time bimanual teleoperation system that prioritizes safety and minimal delay. It also features human haptic feedback to enhance immersion. High-quality demonstration is colle...

AI场景开源机器人

2024年7月9日

0 357

AI项目

FunAudioLLM：阿里通义音频生成开源大模型

FunAudioLLM：阿里通义音频生成开源大模型

CosyVoice 致力于自然语音生成，支持多语言、音色和情感控制，在多语言语音生成、零样本语音生成、跨语言声音合成和指令执行能力方面表现卓越。多语言合成：采用了总共超15万小时的数据训练，支持中英日粤韩5种语言的合成，合成效果显著优于传统语音合成模型。极速音色模拟：仅需要3~10s的原始音频，即可生成模拟音色，甚至包括韵律、情感等细节。在跨语种的语音合成中，也有不俗的表现。富文本或自然语言...

AI语音底层工具开源

2024年7月8日

0 345

AI项目

4M: 提供图像分类、目标检测、语义分割、实例分割、深度估计、表面法线估计等数十种功能

4M: 提供图像分类、目标检测、语义分割、实例分割、深度估计、表面法线估计等数十种功能

A framework for training any-to-any multimodal foundation models. 用于训练任意多模式基础模型的框架。 Scalable. Open-sourced. Across tens of modalities and tasks. 可扩展。开源。跨越数十种模式和任务。 Demo地址： https://huggingface.co/space...

大模型学习开源视觉模型

2024年7月7日

0 290

AI项目

Quivr：用于构建 GenAI Second Brains 的开源 RAG 框架

Quivr：用于构建 GenAI Second Brains 的开源 RAG 框架

Key Features 🎯 主要特点🎯 Fast and Efficient : Designed with speed and efficiency at its core. Quivr ensures rapid access to your data. 快速高效：设计以速度和效率为核心。 Quivr 确保快速访问您的数据。 Secure : Your data, your control....

RAG 底层工具开源

2024年7月7日

0 280

AI项目

fish-speech：Brand new TTS solution

Fish Speech：人人都可克隆声音且带情感的开源AI语音模型，该TTS模型与chat-tts、seed-tts同一级别，且支持自定义训练，支持本地化部署官网： https://speech.fish.audio/ 源码地址： https://github.com/fishaudio/fish-speech...

AI语音开源

2024年7月5日

0 250

Dataherald：Text-to-SQL 引擎

Dataherald：Text-to-SQL 引擎

Dataherald is a natural language-to-SQL engine built for enterprise-level question answering over relational data. It allows you to set up an API from your database that can answer questions in plain ...

text2sql 底层工具开源

2024年7月5日

0 272

Gorilla：用大模型调用1600个API，AGI时代真的来了

Gorilla：用大模型调用1600个API，AGI时代真的来了

Gorilla是一个为大型语言模型设计的API商店，支持通过自然语言查询调用API，实现语义和语法正确的API调用。它通过整合超过1600个API，首次展示了使用LLM调用API的方法，有效减少了生成假象的问题。此外，Gorilla还发布了APIBench，这是一个庞大的、经过策划且易于训练的API集合。 Gorilla是一个基于 LLaMA 的微调模型，在编写 API 调用方面超越了 GPT-4...

底层工具开源

2024年7月4日

0 364

OmniParse：清洗非结构化的数据，提升RAG质量

OmniParse：清洗非结构化的数据，提升RAG质量

OmniParse is a platform that ingests/parses any unstructured data into structured, actionable data optimized for GenAI (LLM) applcaitons. Whether working with documents, tables, images, videos, audio ...

底层工具开源数据处理

2024年7月4日

0 989

wiseflow：信息挖掘 AI 神器，省时高效

wiseflow：信息挖掘 AI 神器，省时高效

首席情报官（Wiseflow）是一个敏捷的信息挖掘工具，可以从网站、微信公众号、社交平台等各种信息源中按设定的关注点提炼讯息，自动做标签归类并上传数据库。功能特色 🚀 原生 LLM 应用我们精心选择了最适合的 7B~9B 开源模型，最大化降低使用成本，且利于数据敏感用户随时完全切换至本地部署。 🌱 轻量化设计不用任何向量模型，系统开销很小，无需 GPU，适合任何硬件环境。 🗃️ 智能信息提...

信息挖掘底层工具开源

2024年7月2日

0 1013

WebDesignAgent：网页生成An agent used for webdesign

WebDesignAgent：网页生成An agent used for webdesign

WebDesignAgnet is an autonomous agent that can help you build a series of websites. WebDesignAgnet 是一个自主代理，可以帮助您构建一系列网站。 It supports building webpages with: 它支持通过以下方式构建网页： Text → Website : Transform y...

开源效率工具网页生成

2024年7月2日

0 225

llm-viz：大模型3D可视化，解析大模型的运作过程

llm-viz：大模型3D可视化，解析大模型的运作过程

这个项目展示的是一个GPT风格网络的工作实现的3D模型，也就是在OpenAI的GPT-2、GPT-3，甚至可能是GPT-4中使用的网络拓扑。首先展示的带有工作权重的网络是一个微型网络，它能够对字母A、B和C的小的列表进行排序。源码地址： https://github.com/bbycroft/llm-viz https://github.com/czhixin/llm-viz-cn...

大模型学习开源

2024年6月20日

0 352

Omnivore：一个完整的免费、开源“稍后阅读”应用程序，无干扰、注重隐私，专为知识工作者和终身学习者设计

Omnivore：一个完整的免费、开源“稍后阅读”应用程序，无干扰、注重隐私，专为知识工作者和终身学习者设计

优点：跨平台：Omnivore 支持 Web、iOS、Android、PWA 以及浏览器扩展等多种平台，方便用户在不同设备上进行阅读。开源：Omnivore 采用开源模式，意味着其源代码可以公开查看和修改。这使得用户可以更加信任这款应用程序，并为其未来发展提供建议和贡献。插件地址： Chrome 浏览器：https://omnivore.app/install/chrome Edge 浏览器...

开源稍后阅读

2024年6月19日

0 393

关于我们

新优态AI社区，收录AI项目、开源项目、创新场景等。

商务合作请电话咨询，感谢您的关注！

归档

标签

AGPL-3.0开源 AI Agent AI-Code AI-搜索 AI场景 AI声音 Ai数字人 AI翻译 AI语音 GraphRAG meta MIT开源 PC RAG SaaS text2sql YC 二次元企业支持体育信息挖掘公文写作医疗大模型学习大模型评估应用场景底层工具底层应用底层技术开源开源Apache-2.0 license 推理提示词Prompt 效率工具数据分析数据处理文生图智能客服智能硬件机器人爬虫电商直播卖货稍后阅读笔记算法网页生成视觉模型视频分析工具视频处理语音阿里非开源面壁智能音响音视频转录