文心大模型X1.1在问答、工具调用、智能体、指令遵循、逻辑推理、数学、代码任务的效果显著提升,事实性显著提升;上下文长度扩展到64K tokens,支持更长的输入与对话历史,在保持响应速度的同时,提高了长链路推理的连贯性。
DeepSeek-V3.2-Exp 模型,这是一个实验性(Experimental)的版本。作为迈向新一代架构的中间步骤,V3.2-Exp 在 V3.1-Terminus 的基础上引入了 DeepSeek Sparse Attention(一种稀疏注意力机制),针对长文本的训练和推理效率进行了探索性的优化和验证。
Qwen 系列中的一个图像生成基础模型,在 复杂文本渲染 和 精确图像编辑 方面取得了显著进展。实验显示,该模型在图像生成和编辑方面具有强大的通用能力,尤其是在文本渲染方面表现尤为出色,特别是对于中文。
百度自研的iRAG(image based RAG),检索增强的文生图技术,将百度搜索的亿级图片资源跟强大的基础模型能力相结合,就可以生成各种超真实的图片,整体效果远远超过文生图原生系统,去掉了AI味儿,而且成本很低。iRAG具备无幻觉、超真实、立等可取等特点。
百度蒸汽机(MuseSteamer)音视一体化视频生成模型,支持单人、多人对话,实现多角色、场景、人声和环境音的协同生成和融合,并可唇形同步。影视级画面质感、丝滑运镜、以及逼真的人物情绪。
百度蒸汽机(MuseSteamer)音视一体化视频生成模型,支持单人、多人对话,实现多角色、场景、人声和环境音的协同生成和融合,并可唇形同步。影视级画面质感、丝滑运镜、以及逼真的人物情绪。
百度蒸汽机(MuseSteamer)音视一体化视频生成模型,支持单人、多人对话,实现多角色、场景、人声和环境音的协同生成和融合,并可唇形同步。影视级画面质感、丝滑运镜、以及逼真的人物情绪。