💥 X-Portrait2在头部动作、微小表情变化和情感传递方面展现更高准确性,适用于动画内容创作,亚马逊正在开发一种名为“Olympus”的多模态大型语言模型,预计将在下周的AWS re:Invent大会上发布。该模型不仅能处理文本,还能处理图像和视频,具有广泛的应用潜力。,特斯拉公司对其人形机器人“Optimus”进行了重大的手部设计升级,新增22个自由度和柔软的保护层,提升了机器人的灵活性和触觉感应能力。这一创新将为机器人在家庭、医疗和工业等领域的应用提供更多可能性,展示了特斯拉在机器人技术领域的持续探索。,👍 S2.0Pro友好易用,适合小白,能自动判断图片信息生成视频。,Fugatto是NVIDIA推出的一款革命性音频生成模型,具备25亿参数,旨在通过文本和音频输入为音乐创作提供灵活支持。该模型突破了传统音频生成的局限,采用创新的数据生成方法和可组合音频表示变换技术,使艺术家和开发者能够实时生成和修改声音。
💡 模型应用于新能源领域,提升新能源发电功率和电力负荷预测准确率。,在体验了字节的PixelDance视频生成模型后,我深感其强大的功能。无论是P2.0Pro还是S2.0Pro,都展现了出色的生成效果,尤其在复杂运动和镜头切换时,P2.0Pro的表现尤为突出。S2.0Pro则更适合初学者,操作简单,效果也相当不错。总体来说,这两个模型各有千秋,用户可以根据需求灵活选择。,🤖 新手部设计具备22个自由度,提升操作灵活性和精准度。
✨ PixVerse V3提供多模态生成能力,包括创意模板和故事续写,提升视频创作的灵活性。,🚀 该模型预计将在下周的AWS re:Invent大会上正式发布,可能作为AWS Bedrock的一部分。,智谱AI近期发布了AutoGLM的多个升级版本,包括浏览器版和电脑版,展现出强大的跨APP操作能力。用户只需一句话即可在多个应用间自由切换和操作,极大提升了效率。,🎨 Blendbox Alpha版重新定义了AI艺术创作方式,让艺术家重新掌控创作过程。
苹果公司近日公布了2024年“年度iPhone应用”入围名单,显示出对人工智能技术在移动应用生态系统中影响的低估。尽管ChatGPT等AI应用在市场上表现出色,但在提名中却未能获得认可。,🤖 搭载多模态AI系统,Star1S在多种环境下实现全天候长续航,满足不同场景需求。,💰 Gemini API定价为每1000个查询35美元,支持实时数据检索。,🤖 模拟的个性被称为“代理人”,未来可能改善工作助手及个人机器人的人机互动体验。,6、爱诗科技PixVerse文生视频、图生视频技术服务全球开放
🤖 新机会也在出现,ChatGPT 技能岗位发布量持续增长,每周增加约0.68个。,🌟 AutoGLM全能助手:支持主流APP,用户可以轻松完成点餐、搜索等任务,展现出AI的智能化和灵活性。
10.Kimi 数学版上线,科学思维解读生活,8、ElevenLabs推开源小项目X-to-Voice:一键将Twitter账号转化为个性化虚拟形象,🌟 Kimi 数学版通过 k0-math 模型提供数学互动体验。,谷歌 AI 工作室与 Gemini API联合推出了“与谷歌搜索的实时连接”功能,旨在帮助开发者提升AI模型的响应准确性。这一功能能从谷歌搜索中获取最新信息,减少虚假信息,提供透明且最新的回答。同时支持动态检索,开发者可根据需要灵活激活实时数据检索,提高回答质量。,6、Rhymes AI推出革命性文本图像视频生成模型Allegro-TI2V
字节跳动旗下的AI助手豆包推出视频生成内测,标志着公司正式进军AI视频生成领域。豆包视频生成支持图片文字一键成片,用户可选择风格比例、添加动态和运镜效果,创造独特视频内容。内测阶段需申请资格,未来将对外开放,让用户自由创作更多视频内容。,Stability AI 发布了新版 Stable Diffusion3.5Large,新增三种 ControlNet 功能,分别是Blur、Canny和Depth,显著提升了图像生成能力。用户可在不商业化的前提下免费使用该模型,尤其是年收入低于100万美元的小型企业和创作者也可享受商业用途的免费使用权。,🔍 新推出的搜索功能改善了信息获取方式,挑战传统搜索引擎。,🤖 该功能基于通义万相ACE模型,用户只需口语化描述意图,即可完成各种图像编辑任务。,10、重磅反转!特朗普计划撤销拜登签署的 AI 监管命令
大模型(LLM)如GPT、Llama等在人工智能领域掀起了革命,但高效训练符合人类价值观仍是难题。字节跳动豆包团队开源HybridFlow框架,为RLHF带来新可能性。HybridFlow结合单控制器和多控制器模式,灵活高效执行RLHF数据流,吞吐量提升20.57倍,推动LLM技术发展。,苹果公司发布了iOS18.2公测版,引入了一系列令人兴奋的人工智能功能,包括AI表情生成器、图像生成工具等。新功能统称为“苹果智能”,基于大型语言模型技术,为用户提供更智能的Siri服务、文本写作和校对助手以及图像生成能力。用户可通过Siri使用新的ChatGPT扩展,进行问题询问、文本撰写、图像生成等。,🚀 xAI在成立16个月内达到了500亿美元的估值,超越了多家竞争对手。