人工智能-工具盒子

阿里开源语音大模型：语音识别效果和性能强于 Whisper，还能检测掌声、笑声、咳嗽等！

2024-07-10 厉飞雨阅读(536) 评论(0) 赞(18)

语音识别技术在人工智能（AI）领域扮演着至关重要的角色，它不仅是人机交互的基石，也是推动智能系统发展的关键驱动力。以下是语音识别在AI领域的一些主要作用： <ol> <li> 改善用户体验：通过语音识别，用户可以与智能设备进行自然语言交流，无...

图片直接生视频：腾讯开源的可控性AI图生视频模型

2024-07-10 厉飞雨阅读(727) 评论(0) 赞(18)

MOFA-Video是一种由腾讯A1实验室和东京大学的研究人员共同开源的图像生成视频模型。该技术通过生成运动场适应器将静态图像动画化，从而生成视频。基于预训练的Stable VideoDiffusion模型，MOFA-Video能够通过稀疏控制信号（如手动轨迹、面部标记序列或音频等）实现对视频生成过程中动作的精细控制。这些控制信号不仅可以单独使用，还可以组合使...

让成语故事动起来，用可灵AI制作成语故事短片实例讲解

2024-07-10 厉飞雨阅读(1859) 评论(0) 赞(19)

当时为了方便大家制作成语故事短片。我还在智谱清言创建了一个成语绘本智能体"阿奇成语故事绘 "。只要在对话框中输入成语，这个智能体就会生成："第一步：成语故事详情-第二步，分镜脚本-第三步，旁白-第四步，绘图提示词-第五步，生成图片"...

10分钟手把手用Coze在家做一整套写真集！（小红书爆火系列）

2024-07-10 厉飞雨阅读(463) 评论(0) 赞(20)

> Coze（扣子）真的是一个非常适合将想法快速落地的好工具，我已经用它来做产品的初期设计前段时间，我在小红书上看到很多使用AI工具为儿童制作写真集的创意案例。这些照片突破了空间限制，展现出各种巧妙的艺术风格，实在令人叹为观止，**吸引了大量的用户关注，这类账号的数据表现整体相当不错，单单一个儿童艺术照主题，就已经造就了许多拥有数万粉丝的博主账号。** ![](htt...

使用Ollama本地部署开源大模型Llama3-7B

2024-07-09 厉飞雨阅读(487) 评论(0) 赞(19)

* **Ollama的安装** 官网地址：Ollama ![](https://img1.51tbox.com/static/2024-07-09/col/9bb0b4b1736a1576c7abba29fd3adfcd/5eb2f29b9d3a418b98ceb01dda0899cd.jpg) ![](https://img1.51tbox.com/static/202...

别了，Photoshop。IOPaint 重新定义图像编辑，开源、免费。设计师值得拥有！

2024-07-09 厉飞雨阅读(426) 评论(0) 赞(14)

<img src="https://img1.51tbox.com/static/2024-07-09/col/edefd64cf62be0f9cf0e63311974574f/d2782b11075a4a9aa8ea53969253e655.jpg" alt="" />随着技术的进步，图像编辑工具也在不断革...