💡 新模型“Olympus”将处理文本、图像和视频,支持自然语言搜索特定视频片段。,💡 新版本整合高级语义分割和改进的边缘检测技术,成功率达90.14%,苹果公司发布了iOS18.2公测版,引入了一系列令人兴奋的人工智能功能,包括AI表情生成器、图像生成工具等。新功能统称为“苹果智能”,基于大型语言模型技术,为用户提供更智能的Siri服务、文本写作和校对助手以及图像生成能力。用户可通过Siri使用新的ChatGPT扩展,进行问题询问、文本撰写、图像生成等。,🌟 新增三种 ControlNet 功能:Blur、Canny和Depth,提升图像生成能力。,⚡ Stable Diffusion3.5Large Turbo具备更快的图像生成速度,适合快速创作。
🌍 DeepL Voice推动实时多语言沟通,🎨 该模型引入了后续视频生成和中间视频生成两种新模式,极大提升了视频创作的灵活性与效率。,🤖 豆包视频生成采用AI算法,自动将图片和文字转化为视频内容。,字节跳动旗下的AI助手豆包推出视频生成内测,标志着公司正式进军AI视频生成领域。豆包视频生成支持图片文字一键成片,用户可选择风格比例、添加动态和运镜效果,创造独特视频内容。内测阶段需申请资格,未来将对外开放,让用户自由创作更多视频内容。,📸 团队发布了超过20万张图像的数据集Subjects200K,助力进一步的研究与探索。
👗 FLUX.1-dev LoRA 服装生成器利用先进的人工智能技术,让用户体验前所未有的时尚设计过程。,📱 增加对混合现实内容的支持,可编辑空间视频,支持Vision Pro头显和iPhone系列拍摄。,Stability AI最近推出了全新的深度学习文本到图像生成模型Stable Diffusion3.5,包括三种改进的开源模型,满足不同用户需求。其中Stable Diffusion3.5Large是最强大的模型,参数高达81亿,可生成1兆像素高质量图像。Stable Diffusion3.5Large Turbo提升了速度,适合快速创作。Stable Diffusion3.5Medium平衡了图像生成质量和易定制性,参数为25亿。,🔄 用户可以选择让ChatGPT搜索网络或手动点击搜索图标进行搜索,使获取信息更便捷。
💻 Rhymes AI在Apache2.0许可下发布Allegro-TI2V,用户可通过简单安装快速上手,应用前景广泛。,🌟 AutoGLM全能助手:支持主流APP,用户可以轻松完成点餐、搜索等任务,展现出AI的智能化和灵活性。,⚡ 跨APP操作能力:用户只需一句话即可在多个应用间进行操作,极大提升了使用效率。,📱 支持与主流应用兼容,用户可通过眼镜直接接打电话、观看视频,功能接近智能手机。
亚马逊正在开发一种名为“Olympus”的多模态大型语言模型,预计将在下周的AWS re:Invent大会上发布。该模型不仅能处理文本,还能处理图像和视频,具有广泛的应用潜力。,4、特斯拉 “Optimus ” 机器人升级:手部设计更灵巧、更敏感!,💻 Rhymes AI在Apache2.0许可下发布Allegro-TI2V,用户可通过简单安装快速上手,应用前景广泛。
📱 支持与主流应用兼容,用户可通过眼镜直接接打电话、观看视频,功能接近智能手机。,⚡ 跨APP操作能力:用户只需一句话即可在多个应用间进行操作,极大提升了使用效率。,🔗 用户可以选择将自己的Persona设为公开或私密,拥有独立页面,展示在创作者的资料库和个人主页中,增加音乐创作的社交价值。,🌐 ChatGPT 用户数在两年内激增,成为家庭中重要的数字助手。,🚀 该模型预计将在下周的AWS re:Invent大会上正式发布,可能作为AWS Bedrock的一部分。
2、阿里国际AI团队开源开放型问题推理模型Marco-o1,金融分析师Dan Nystedt透露,OpenAI正与三星电子洽谈合作,计划将ChatGPT集成到三星最新的Galaxy AI系统中。这一合作有望提升三星AI系统的语言理解和交互能力,可能对谷歌的Gemini构成挑战。,8、ElevenLabs推开源小项目X-to-Voice:一键将Twitter账号转化为个性化虚拟形象,谷东科技推出的Star1和Star1S眼镜代表了AI与AR技术的完美结合,提供了全彩显示和强大的AI功能。这些眼镜不仅在设计上考虑了佩戴舒适度,还在技术上实现了高清画质和多模态AI系统的应用。Star1S作为业内首款全彩双目阵列光波导AR眼镜,预计将于12月上市。,🤖 模拟的个性被称为“代理人”,未来可能改善工作助手及个人机器人的人机互动体验。
💰 Chat.com曾以1550万美元被HubSpot联合创始人收购。,谷歌地图近日宣布通过Gemini生成式AI模型进行重大升级,提供智能导航和全新场所发现体验,展示技术实力和用户体验持续努力。,⚙️ HybridFlow的3D-HybridEngine组件支持高效模型权重重组,减少内存冗余和通信开销,提升训练效率。,📹 豆包视频生成支持一键成片,转化信息为生动视频内容。,在生成式人工智能领域,Exo Labs利用Apple M4芯片成功在本地计算集群上运行强大的开源AI模型,为用户提供了降低成本、提高隐私安全的解决方案,避免对云服务的依赖。他们计划推出基准测试网站,帮助用户选择适合的硬件配置进行AI任务。【AiBase提要:】