UCloud小助手的专栏列表

谷歌发布Veo：文生超1分钟、1080P视频媲美Sora

Veo是什么Veo是由Google DeepMind开发的一款视频生成模型，用户可以通过文本、图像或视频提示来指导其生成所需的视频内容，能够生成时长超过一分钟1080P分辨率的高质量视频。Veo拥有对自然语言的深入理解能够准确捕捉和执行各种电影制作术语和效果，如延时摄影或航拍镜头。Veo生成的视频不仅在视觉上更加连贯一致，而且在人物、动物和物体的动作表现上也更加逼真。Veo的开发旨在使视频制作更加...

UCloud小助手发布于AGI专区 2024-05-22 15:32
微软发布最强Al电脑:Copilot+PC，能听、能看、能说而且能记住你一切

5月20日，微软在其特别活动上，向世界介绍了一种新类别的WindowsPC，一款专为AI设计的Copilot+ PC。Copilot+ PC引入了全新的系统架构，将 CPU、GPU和高性能神经处理单元(NPU)结合在一起，并与 Azure 云中的大语言模型(LLM)和小语言模型(SLM)协同工作，带来前所未有的性能水平。微软宣称Copilot+ PC是迄今为止最快、最智能的Windows PC。它...

UCloud小助手发布于AGI专区 2024-05-22 15:30
DeepSeek发布236B参数 160位专家的专家混合(MoE)模型:DeepSeek-V2

项目简介DeepSeek-V2，一个专家混合(MoE)语言模型，其特点是经济高效的训练和推理。它包含 2360 亿个总参数，其中每个token激活了21亿个参数。与 DeepSeek67B相比，DeepSeek-V2 实现了更强的性能，同时节省了 42.5%的训练成本，将 KV 缓存减少了 93.3%，并将最大生成吞吐量提高了 5.76 倍。在 AlignBench 中排名前三，超越 GPT-4，...

UCloud小助手发布于AGI专区 2024-05-16 09:54
Llama3中文聊天项目全能资源库，4090单卡直接跑！

Llama3 中文聊天项目综合资源库，该文档集合了与Lama3 模型相关的各种中文资料，包括微调版本、有趣的权重、训练、推理、评测和部署的教程视频与文档。1. 多版本支持与创新：该仓库提供了多个版本的Lama3 模型，包括基于不同技术和偏好的微调版本，如直接中文SFT版、Instruct偏好强化学习版、趣味版等。此外，还有Phi3模型中文资料仓库的链接，和性能超越了8b版本的Llama3。2. 部...

UCloud小助手发布于AGI专区 2024-05-16 09:45
能自动化视频剪辑的开源工具来了！剪辑师、自媒体作者狂喜

项目简介Funclip 是阿里巴巴通义实验室开源的一款视频剪辑工具，专门用于精准、便捷的视频切片。它能够自动识别视频中的中文语音并允许用户根据语音内容来裁剪视频。该工具使用了阿里巴巴语音识别模型FunASR Paraformer-Large确保了剪辑的精准性。你可以根据识别结果选择文本片段或说话人进行视频裁剪。使得视频剪辑变得非常方便。Funclip不仅支持中文，未来还将支持英文视频剪辑，是视频内...

UCloud小助手发布于AGI专区 2024-05-16 09:40