郝彦飞 description-generator:基于Llama 3.2 Vision的电商项目,根据商品图片生成多语言产品描述,为电商行业的产品描述提供了一种AI自动化解决方案 视频介绍: https://www.youtube.com/watch?v=XiFuREslh84 源码地址: https://github.com/Nutlope/description-generator 官网Demo: https://product-descriptions.vercel.app/... 底层工具 开源 电商
郝彦飞 WiLoR: 实时的高精度手部3D重建与追踪 代码: https://github.com/rolpotamias/WiLoR 项目主页: https://rolpotamias.github.io/WiLoR/... 底层技术 开源
郝彦飞 GenAI Agents:涵盖16种场景的agents,包含AI数据分析、AI生成动画gif、AI生成音乐、AI论文评分 This repository provides tutorials and implementations for various Generative AI Agent techniques, from basic to advanced. It serves as a comprehensive guide for building intelligent, interactive AI s... AI Agent 应用场景 开源
郝彦飞 EasySpider:一个可视化浏览器自动化测试/数据采集/爬虫软件 A visual no-code/code-free web crawler/spider易采集:一个可视化浏览器自动化测试/数据采集/爬虫软件,可以无代码图形化的设计和执行爬虫任务。别名:ServiceWrapper面向Web应用的智能化服务封装系统。 官网: https://www.easyspider.net/ 视频介绍: https://www.bilibili.com/video/BV1... 底层工具 开源 爬虫
郝彦飞 同济子豪兄-vlm_arm:机械臂+大模型+多模态=人机协作具身智能体 机械臂接入GPT4o大模型,秒变多模态AI贾维斯 通过语音指令,让机械臂指哪打哪。听人话、看图像、找坐标、排动作、定格式 智能体Agent编排动作,多模态视觉大模型理解图像 最后通过手眼标定和逆运动学解算,依次完成动作 具身智能体Agent,让机器能理解人类的复杂指令,实现人机协作 源代码: https://github.com/TommyZihao/vlm_arm 机械臂:大象机器人Mycobo... 开源 机器人
郝彦飞 IoA:AI Agent的互联网时代来临,面壁智能发布agent协同协议 Imagine if AI agents could collaborate like humans do on the internet. That's the idea behind Internet of Agents (IoA)! It's an open-source framework that aims to create a platform where diverse AI ag... AI Agent 开源 面壁智能
郝彦飞 AgentScope:阿里发布开源可视化构建workflow的agent开源框架,可视化实现多体agent的构建 源码地址: https://github.com/modelscope/agentscope 文档地址: https://modelscope.github.io/agentscope/en/index.html 参考教程: AgentScope:阿里发布开源可视化构建workflow的agent开源框架,可视化实现多体agent的构建... AI Agent 开源 阿里
郝彦飞 llm-graph-builder:GraphRAG的可视化开源框架,利用大模型从非结构化数据中提取知识图谱,实现向量+kg的结合进行知识问答 Overview 概述 This application is designed to turn Unstructured data (pdfs,docs,txt,youtube video,web pages,etc.) into a knowledge graph stored in Neo4j. It utilizes the power of Large language models (... RAG 底层工具 开源
郝彦飞 MOA:实现本地混合智能体,击败GPT-4o Together Mixture-Of-Agents (MoA) – 65.1% on AlpacaEval with OSS models 混合代理 (MoA) – 在 AlpacaEval 和 OSS 模型上为 65.1% Mixture of Agents (MoA) is a novel approach that leverages the collective strengths of... 开源 推理
郝彦飞 Cake:Distributed LLM inference for mobile, desktop and server. Cake is a pure Rust implementation of the LLama3 distributed inference based on Candle . The goal of the project is being able to run big (70B+) models by repurposing consumer hardware into an heterog... 底层工具 开源 推理
郝彦飞 Open-TeleVision:超远距离沉浸式主动视觉反馈开源操作系统 Open-TeleVision: Teleoperation with Immersive Active Visual Feedback Open-TeleVision:具有沉浸式主动视觉反馈的远程操作 源码地址: https://github.com/OpenTeleVision/TeleVision 官网地址: https://robot-tv.github.io/... 开源 机器人
郝彦飞 CopilotKit:用于构建自定义 AI Copilots 应用内 AI 聊天机器人、应用内 AI 代理和 AI 驱动的文本区域的框架。 How does it work 它是如何工作的 Define the following simple entry-points into your application, and the CopilotKit🪁 execution engine takes care of the rest! 在您的应用程序中定义以下简单的入口点,CopilotKit🪁执行引擎会处理其余的事情! Applic... AI场景 底层工具 开源