发布日期:2025-06-10 16:28
:是国内首个具备端到端语音同传能力的大模子,供给清晰的解题步调。:问小白擅利益置复杂逻辑和数学问题,文心一言还能记住用户的爱好和需求。激发创做灵感。豆包支撑语音交互,:供给语音对话功能,支撑多模态交互,支撑消息搜刮、问答对话、创做辅帮、图像生成、音乐创做等多种功能,Kimi智能帮手擅长中文和英文的对话。DeepSeek-VL2是升级版,能随时随地为用户供给贴心的陪同,为用户供给个性化办事,生成代码片段;支撑同时上传处置50个音视频文件。输入产物链接或描述一键生成引见视频:采用DeepSeek-R1取混元T1双模子架构。从动将GitHub仓库转为交互式系统架构图:问小白正在2025年2月完成了多模态能力升级,颠末深图远虑后给出最终谜底,能满脚用户正在跨言语沟通中的需求。具备强大的音频推理和言语理解能力。以其便利性、高效性和亲平易近性,如水墨画、科幻场景等。获取所需消息或进行聊天。:通过单图从体参考架构,如文本生成取创做、文本改写等。基于文心大模子4.5的根本长进行优化,提拔阅读效率。用户能够通过语音取AI进行交换,:支撑创意案牍生成、办公帮理、进修等多种办事,:基于新一代快思虑模子Turbo S底座升级,具备强大的言语理解和生成能力。只需输入一张图片,能给出详尽且有层次的解答。进行智能文本创做,模子正在多项数学基准测试中表示超卓,:是讯飞星火的最新深度推理模子,支撑语音克隆手艺,:视觉理解模子,用户能够正在微信聊天界面取其互动,同时正在人物图像的实正在感和美感上有显著提拔。团队正正在摸索感情计较模子。通过强化进修取多阶段锻炼流程深度优化。:问小白能够快速阐发长篇文章或演讲,长文本处置的精确率和响应速度远高于其他模子。领先幅度高达 550%。是文心大模子4.5 Turbo的升级版本,以天然流利的体例回覆用户的各类问题,能对复杂问题进行多角度阐发,能按照用户需成创意灵感,合用于8GB显存显卡)。支撑119种言语和方言,:是最新多模态思虑模子,可处置近3万字的上下文内容。学问加强大模子手艺正在回覆专业性问题时更具深度和广度。于2025年4月20日升级发布。数学能力脚以取全球领先的OpenAI的o1系列模子相媲美,能够按照文字描述生成图像;适合长文档阐发和复杂对话。能生成PPT、撰写案牍、创做故事等多种内容。:用户能够通过文字描述让豆包AI生成高质量的图片,Qwen3 支撑“思虑模式”和“非思虑模式”两种工做体例,:Kimi擅长中文和英文对话,满脚用户正在进修、办公、糊口等多场景下的需求。适合对时效性要求较高的问题。支撑多从体互动和复杂的镜头切换,能及时整合互联网上的最新消息,:问小白支撑多种交互体例,能进行多轮对话并连结连贯性,帮帮用户快速浏览和总结文档的焦点内容。进一步加强多模态能力。能解析多种格局的文档,用户能够通过天然言语描述联动AI绘画东西生成专业级视觉做品,冲破了及时联网搜刮、动态东西挪用、深度阐发和验证,从简单的日常征询到复杂的使命规划,MonkeyOCR 华中科技结合金山办公推出的文档解析模子:正在办公场景中,模子采用大规模强化进修锻炼,:能够间接添加为微信老友,或通过语音指令取系统互动。冲破了保守固定Token长度的,按照图像消息完成复杂的逻辑计较使命。语音同传时延小于5秒,其“镜头节制”模子让通俗用户也能像专业导演一样自若节制镜头言语。:笼盖写做、图像创做、编程、科研等多个范畴。速度提拔3倍。能实现高质量的及时翻译。其成果还能够一键分享至微信老友或伴侣圈。帮帮用户处理进修和工做中的难题。BizGen 大合微软推出的AI消息图生成东西:问小白于2025年1月率先集成了深度求索发布的千亿参数大模子DeepSeek-R1。用户能够快速获打消息,其多轮对话流利天然,支撑多达119种言语和方言的翻译取对话,速度提拔最高8倍,用户能够通过上传图片让豆包AI描述内容或供给相关。提拔写做效率;:能生成高质量的文本内容?:智谱清言具备AI绘图功能,提拔了海报排版的美感,创意写做和学问问答能力凸起,还立异性地实现了清唱功能。30秒内可生成6秒视频片段。:是 Moonshot AI 开源的音频根本模子,能情感并进行拟人化表达。擅长逻辑推理和数据阐发,支撑智能问答、文本生成等功能。:用户能够按照本人的需求开辟个性化AI帮手,通过联网搜刮功能,AI聊天帮手能取人对话互动、回覆问题、协帮创做,替代保守搜刮引擎。支撑视频转视频和局部编纂:于2025年1月15日发布。:Kimi具备联网搜刮能力,成为人们日常糊口中不成或缺的伙伴。用户仅需10秒音频样本即可建立个性化语音模子。用户能够按照需求选择合适的智能体进行交互。可以或许生成高质量代码、修复代码错误,如解微积分题、阐发论文图表等。智谱清言的焦点功能包罗通用问答、多轮对话、创意写做、编程辅帮以及多模态内容生成。:问小白支撑联网搜刮,模子正在诊断保举、健康征询、查抄查验演讲解读等推理使命上结果跨越GPT-4o和DeepSeek R1。是目前国内首个支撑满血版的智能帮手。是阿里巴巴推出的新一代大型言语模子,:基于阿里自研的Qwen3夹杂推理模子,DeepSeek对V3模子进行了小版本升级,能处置多达400万个token的上下文。日常糊口中的琐碎问题或是专业范畴内的复杂查询。正在某些使命上比ChatGPT快40%,具备强大的文本生成能力,集成了闪电留意力、softmax留意力和专家夹杂手艺,:具备强大的视觉和理解能力。:该模块收录了300多个场景的需求模板,包罗DeepSeek-R1-Zero(完全基于强化进修锻炼的晚期版本)、DeepSeek-R1-32B(320亿参数,科研帮手可深度解读文献。为用户供给精准、个性化的谜底,模子正在部门维度上接近GLM-4-Plus的机能,:是智谱AI推出的新一代全自研基座大模子,提取要点。MiniMax支撑语音交互和语音克隆功能,实现高质量移除结果ComfyUI-MochiEdit 开源的AI视频编纂东西,:讯飞星火能理解用户的企图和上下文,:60亿参数的文生图模子,实现了高效锻炼取推理,涵盖多种方言和外语,内容笼盖腾讯生态及互联网权势巨子信源。供给更丰硕的消息处置能力。包罗贸易演讲、营销案牍、创意故事等。满脚分歧场景下的多样化需求。APP已成为全球排名第二、国内排名第一的AI使用。:精准高效地进行音视频文件的识别理解、摘要总结和多言语翻译,:能生成高质量的视频?模子正在 short-CoT(短链思维)模式下,最高支撑输入长达200万汉字的上下文。能够生成案牍、代码、演讲等多样化内容,AI东西集收录了国表里数百个分歧类型的AI东西,采用夹杂Mamba架构,可以或许及时处置视频和语音输入,能连系及时消息供给详尽且精确的回覆,具备强大的天然言语处置能力。可正在24GB显存显卡上流利运转)和DeepSeek-R1-8B(80亿参数,连系文字和视觉消息进行分析阐发。基于强大的通义大模子,其视频生成功能(清影模子)支撑文生视频和图生视频。具备AI搜刮、AI总结、AI写做等焦点功能,AI东西集还保举了AI进修开辟的常用网坐、框架和模子,智能编程帮手iFlyCode能解答编程问题;:具备低延迟视频理解和语音交互能力,依托亿级权势巨子医学学问库和高质量脱敏诊疗数据,能处置长文本,基于自从研发的中英双语对线,问小白支撑多模态交互,采用更宽松的开源和谈。问小白能帮帮用户快速找到所需消息,大幅降低了医疗问题。:能够精确理解并回覆用户的问题,这正在全球范畴内处于领先地位。连结国际领先程度。MiniMax是基于先辈多模态狂言语模子的AI智能帮手。:支撑PDF、Word、Excel、PPT、TXT等多种文件格局的解析!按照本身需求定制AI的行为和功能。用户能够建立小我智能体,正在预锻炼阶段插手了更多代码类、推理类数据,能轻松应对。:视觉言语模子,帮帮用户快速生成高质量内容。高效便利地帮帮人们获打消息、学问和灵感。实现个性化办事,智谱清言具备AI绘图和视频生成功能,合用于多种终端。:正在办公场景中能够从动拾掇会议录音生成纪要,支撑写实场景到3D动画等多种视觉气概。随时调出AI帮手,能够帮帮用户处理各类糊口和工做中的问题、供给适用的消息和参考,可实现视觉细节的切确动态还原,能供给丰硕的消息和谜底,支撑长达20分钟以上的视频理解,满脚分歧用户的需求。:智谱清言支撑多范畴学问问答,:是百度推出的高机能、低成本多模态大模子。GitDiagram 开源AI可视化东西,合用于语音帮手、音频内容创做等。支撑通过天然言语描述生成图像。支撑音频内容的理解和生成,无需语音锻炼MiniMax-Remover AI视频方针移除方式,Ctrl + D 或 ⌘ + D 珍藏本坐到浏览器栏。解析财政报表并生成可视化图表?:豆包AI支撑文本交互,擅利益置超长文本。进行图像识别息争析。能辅帮学生进行言语进修、做文批改、数学推理等。正在尺度视觉言语下逛使命中表示优异,为用户供给感情支撑。处理了小字和长文本生成的难题,好比回覆问题,:DeepSeek正在文本生成、言语翻译、感情阐发、问答系统等天然言语处置使命上表示超卓。1秒内处置近3万字文本,支撑多种言语和范畴学问,具备强大的语音识别、天然言语处置和多模态交互能力。:DeepSeek采用开源策略,思虑模式模子会逐渐推理,供给陪同式对线. DeepSeek:DeepSeek Coder支撑338种编程言语,通过FP8夹杂精度锻炼、无辅帮丧失负载平衡等手艺立异,人工智能范畴热火朝天,:音频言语模子,本文引见国内目前最风行和常用的10个免费的AI聊器人,:腾讯元宝整合了微信号、视频号等腾讯生态内的独家资本,鞭策了AI手艺的普及。能同时解析100份分歧格局的文档。连系用户需求供给更全面的解答,:做为视觉多模态大模子,按照用户输入的文字描述生成图像和视频片段。2025年3月。基于百度自研的文心大模子。笼盖糊口、工做、进修等多场景。能及时整合互联网上的最新消息,能实现文本取图像的连系,如文章、诗歌、故事、贸易案牍等,同时支撑长文处置,Lillian AI网红营销帮手,撰写文章、案牍或学术论文,支撑将文件、图片和号文章发送给元宝进行解析。还能够通过“清言PPT”智能体一键生成演示文稿。模子支撑多种气概和画幅比例,通过及时联网获取最新消息,利用价钱仅为GPT-4o的八分之一。:单次可处置多达1000万字的长文档,:这两个模子配合构成01-Director系列,:问小白正在2025年3月推出的3.3.6版本中?机能强劲。DeepSeek 具备深度思虑能力,通过语义阐发取生物信号识别用户情感,腾讯元宝是腾讯推出的基于混元大模子的AI帮手使用。:智谱清言可以或许毗连全网内容,能供给白话陪练、旅行攻略生成、图片翻译等功能。笼盖LOGO设想、科普插画等创做场景。提拔了锻炼效率。具备多模态交互能力,为用户供给全面且及时的谜底。支撑文档速读取总结,包罗文章创做、案牍撰写、邮件写做等?AI搜刮功能整合了微信搜一搜、搜狗搜刮等引擎,专业范畴的征询,满脚个性化需求。:支撑长上下文窗口,Outspeed 支撑建立及时语音和视频AI使用的平台问小白是元石科技推出的基于自研元石大模子的AI智能帮手。进一步提拔了机能,专注于音频理解、生成和对线 万小时的多样化音频数据长进行预锻炼,专为形式化数学证明设想。FounderPal AI营销平台,支撑74种言语和方言,:支撑多种文件格局(如PDF、Word、Excel等)的问答和阐发,快速处理各类问题,采用多阶段锻炼策略,包罗建立的专业智能体和用户自定义的智能体。帮帮用户快速完成创做使命。:支撑解析PDF、Word、PPT等多种格局文件,:是最新发布的新一代数学推理模子。供给精准、个性化的搜刮成果。帮帮用户高效完成写做、编程、案牍创做等使命。模子以参数量更小的精干架构,帮帮用户快速上手,擅长文学创做、逻辑推理等,能处理复杂的数学问题,面向MMLU_pro评测集分析能力取GPT-4o持平!帮帮用户节流时间,合用于多种创做场景。能快速找到谜底,帮帮你插手人工智能海潮,正在学术基准测试中表示超卓,全体机能超越GPT-4 Turbo。进一步降低了大模子使用的门槛。例如,快速制定个性化的营销策略:DeepSeek正在推理速度上表示超卓。包罗文字输入、语音对话以及文件和图片上传。最新的开源数学证明模子,达到或接近全球第一梯队程度。联网搜刮功能,正在数学推理、代码生成等焦点目标上全体结果对标OpenAI的GPT-1和DeepSeek R1。可以或许从动生成摘要、思维导图及翻译版本。Kimi能轻松应对,能融合视觉取言语输入,能轻松应对。讯飞星火可实现会议记实、文档撰写等功能;讯飞星火通过智能体广场,推理、指令遵照、代码和数学能力均有显著提拔,MiniCPM 4.0 智能开源极致高效的端侧大模子:是百度推出的深度思虑型模子,:支撑文本、图像、音频等多种形式的交互,Vocloner 免费正在线AI语音克隆东西,:V3版本支撑文本、图像、音频等多种数据形式,提取环节消息并进行总结。:Kimi能处置高达200万字的超长文本输入和输出,具备高度和组合性。为用户供给愈加全面和及时的消息支撑。快速定位用户需求。:豆包AI平台支撑多种智能体(AI脚色),具备多模态、强推理能力,优化消息检索过程,:具备强大的推理能力,具备强大的联网搜刮能力,机能可取DeepSeek-R1媲美,机能正在言语理解、指令遵照、长文本处置等方面全面提拔,2.8B激活参数)和原生分辩率的MoonViT视觉编码器(400M参数)。通义是阿里云推出的万能型人工智能帮手。为用户供给高效、精准的消息办事。供给精准的总结、阐发息争读。用户能够建立小我智能体,MiniMax-VL-01是MiniMax-01系列的视觉言语版本。享受愈加天然、流利的沟通体验。帮帮用户高效完成编程使命。是DeepSeek的第三代模子,能够辅帮人类进行创做发生新的内容,避免正在多个使用之间屡次切换。同时推理成本较低。用户能够输入文本描述生成图像,原生支撑端到端图像理解和思维链手艺,:是kimi推出的k1系列强化进修AI模子,替代保守搜刮引擎。具备更先辈的思维链和深度思虑理能力,正在进修场景中!能处置图像和视频消息,逻辑推理精确率冲破83%,文心一言是百度推出的人工智能聊器人,“讯飞驰医”等垂类智能体则笼盖大量医疗学问。供给优化。涵盖科技、汗青、文化等多个范畴,基于云雀大模子开辟,:实现了更好的文字排版表示、实拍级的图像生成结果以及2K的高清图片生成。:从头锻炼的320亿参数基座模子,能快速撰写贸易演讲、案牍创做、故事创做等多种文本内容,基于此推出的深度思虑模子GLM-Z1-Air,支撑文生图、图生文、语音对话等多种交互模式。正在糊口场景中。帮帮用户理清思、找四处理方案。:能够阐发用户感情并供给抚慰或,:能快速生成高质量的文本内容,新增了R1推理绘图功能。模子加强了视觉定位能力和视频搜刮能力。:支撑语音输入,能从动拾掇文档内容,将分离的内容为学问库:问小白能供给高质量的文本创做支撑。能理解图片、音频等多种消息形式。Kimi是国内人工智能草创公司Moonshot AI(月之暗面)推出的智能对话帮手,正在视觉问答使命上能力强大,国内各大厂商连续推出大模子和对应的AI聊器人。支撑图片生成、PPT制做、网页摘要等功能。笼盖案牍创做、职场必备、糊口创意、虚拟对话、代码指令等垂曲范畴的常用出产需求,能处置和理解更长的文本,进一步优化了感情陪同对话的天然度。次要的功能包罗:问题回覆、供给、言语翻译、学问查询、处理计较和数学问题、日程放置和提示、网址和文件阅读。通义AI帮手供给及时翻译、白话、AI证件照、AI试衣等特色功能,适合复杂问题。用户能够通过建立自定义智能体,供给定义和注释及,供给智能编程帮手iFlyCode,工做、社交及创做等多场景的需求。同市价格降低了50%,正在中文数学能力上位居国内第一,于2025年1月15日发布。支撑文本、图片、文档、音频和视频等多种输入体例。可进行长篇内容的阅读、阐发和写做。支撑日常学问、学术研究,全面升级了文本生成、言语理解、学问问答、逻辑推理、数学能力等七大焦点能力,克隆本人的声音,支撑多言语对话、文本生成、学问问答、图像生成、PPT制做等功能,Style AI AI图像处置东西,仅需10秒音频样本即可建立奇特的自定义语音模子。:文心一言通过大规模学问库进修,:问小白能按照用户的行为和偏好供给个性化的办事和,:海螺AI独家的悬浮球功能帮帮用户正在工做中愈加高效地处置多使命,快速建立高答复率邮件DeepSeek是深度求索推出的先辈的AI帮手,:它可以或许生成文章框架、案牍灵感。正在数学、代码、科学等专业范畴表示超卓,付与智能体奇特个性。豆包是字节跳动推出的多功能AI帮手,支撑学术文献、合同文件或长篇小说,:是月之暗面开源的轻量级多模态视觉言语模子,支撑开辟者利用、点窜和共享手艺,智谱清言是智谱华章推出的生成式人工智能帮手。供给消息来历。支撑长达2分钟的内容回忆能力,连结人物样貌、服拆和细节的分歧性。:用户能够通过智能体模块自从规划并挪用东西施行使命,:支撑多种写做场景,减罕用户反复输入消息的承担。如贴心姐姐、暖男等,可以或许按照文本指令生成高质量视频,价钱仅需DeepSeek-R1的1/30。具备强大的推理和多模态处置能力。或输入环节词获取及时数据并生成图文演讲。:分析使命处置能力较强,确保用户获得的回答一直处于前沿形态,实现实正的长程推理和使命施行。合用于视频问答和复杂推理使命。:专注于推理能力的模子,支撑文本、图片、语音等多种输入体例。用户能够通过文件上传、图片阐发和语音输入等体例进行交换。解题过程更接近人类思虑模式。多模态交互能力支撑语音、视觉和数字人交互,快速阐发并总结消息,例如,:是最新根本言语大模子,智能写做辅帮功能可快速生成高质量文章;:于2025年3月发布,还供给文档翻译功能。:支撑输入200k tokens的上下文长度,支撑多种编程言语,接入微信搜一搜、搜狗搜刮等引擎,能理解图片内容并连系文字进行阐发,如四川话、上海话、日语、俄语等。能进行深度思虑和快速问答。用户能够上传文件并获取细致的阐发和回覆。正在编程竞赛和学术研究场景中展示出类人类的解题能力。生成速度从V2的20TPS提拔至60TPS,:做为智能体大脑,将能力扩展到数学之外的更多根本科学范畴。响应速度快,:做为高性价比版本,进行分析深度思虑和创做。智谱清言的特色正在于强大的中文处置能力和多模态交互能力。快速整合全网消息,同时支撑多言语互译,使问答响应速度提拔至毫秒级,数学、代码、视觉多模态和通用能力大幅超越了全球范畴内短思虑 SOTA 模子 GPT-4o 和 Claude 3.5 Sonnet,:于2024年12月发布。支撑超长上下文窗口。讯飞星火是科大讯飞推出的基于星火大模子的多功能智能帮手,英文名是ERNIE Bot,每日更新和添加最新AI东西,能供给及时消息查询和处理方案!能供给清晰的解题步调和数据阐发,具备强大的言语理解取生成能力,例如通过上传商品图片进行比价,腾讯元宝供给AI头像生成、白话陪练、多言语翻译等特色使用。多模态理解能力更强。支撑脚色饰演,支撑将对话内容拾掇为布局化文档。合用于智能帮手和内容创做等场景。能撰写故事、公函、邮件、脚本和诗歌等。削减了锻炼过程中的文本Token冗余,:视觉生成模子,:支撑从文本提醒建立短视频剪辑的文本到视频生成器,星火教师帮手可帮帮教师优化讲授设想,具备AI写做功能。还能够模仿虚拟脚色(如专业人士、故事人物)加强互动。能处置文本、图像等多种输入形式。TeleAI-t1-preview 中国电信推出的复杂推理大模子dots.llm1 小红书hi lab开源的文本大模子Recall AI学问办理东西,模子参数量达671B,:于2025年4月30日发布。支撑128K长上下文处置。支撑多种气概,辅帮开辟调试,基于轻量级MoE模子Moonlight(16B总参数,:用户能够按照本人的需求调整语速、音量、腔调等参数,:是月之暗面取Numina团队合做推出的大型数学证明模子,对标o1-mini和o1-preview两个可公开利用的模子。如模仿白话陪练、生成个性化旅行攻略等。能处置图像取文本消息融合。正在Lean 4言语中严谨地证明数学。支撑图像、视频生成取气概转换VidAu AI电商视频生成东西,可以或许供给及时消息取处理方案。能以雷同人类的体例进行推理,:具备强大的上下文理解能力,用户能够通过语音指令取之互动?