51工具盒子

依楼听风雨
笑看云卷云舒,淡观潮起潮落

人工智能

低成本本地部署可公网访问的Dify极简教程

低成本本地部署可公网访问的Dify极简教程

厉飞雨 阅读(1263) 评论(0) 赞(16)

<p>与大家分享一下我自己探索的?低成本?本地部署可公网访问的Dify经验哈,欢迎大家多多交流<img src="https://img1.51tbox.com/static/2024-07-08/col/6c2e4020375a91c1ddc882074108a69f/5501f537df17476fa65c11d6079a5e74.png.jpg...

当旅行遇上插画,我叫它「旅行插画风」。

当旅行遇上插画,我叫它「旅行插画风」。

厉飞雨 阅读(352) 评论(0) 赞(15)

<p>不知道有多少人和我一样不喜欢拍照,但又喜欢到处玩~如果只拍美景未免显得有点单调,真人出镜又会很社恐。 今天发现了一种好看又好玩的玩法,就是把目的地P上卡通人物~既好看,又有新意,目前我在自媒体平台上还没看见几个人这么玩儿,或许可以测一测流量哦。 <strong>操作过程巨简单,有手就能做。</strong> 第一步,用Midjourne...

阿里通义音频生成大模型 FunAudioLLM 开源!

阿里通义音频生成大模型 FunAudioLLM 开源!

厉飞雨 阅读(581) 评论(0) 赞(17)

**01** **导读** <br /> 人类对自身的研究和模仿由来已久,在我国2000多年前的《列子·汤问》里就描述了有能工巧匠制作出会说话会舞动的类人机器人的故事。声音包含丰富的个体特征及情感情绪信息,对话作为人类最常使用亲切自然的交互模式,是连接人与智能世界至关重要的环节。 <br /> 近日,阿里通义实验室发布并开源了语音大模型项目...

阿里开源语音大模型:语音识别效果和性能强于 Whisper,还能检测掌声、笑声、咳嗽等!

阿里开源语音大模型:语音识别效果和性能强于 Whisper,还能检测掌声、笑声、咳嗽等!

厉飞雨 阅读(536) 评论(0) 赞(18)

<p>语音识别技术在人工智能(AI)领域扮演着至关重要的角色,它不仅是人机交互的基石,也是推动智能系统发展的关键驱动力。以下是语音识别在AI领域的一些主要作用:</p> <ol> <li> <p><strong>改善用户体验</strong>:通过语音识别,用户可以与智能设备进行自然语言交流,无...

图片直接生视频:腾讯开源的可控性AI图生视频模型

图片直接生视频:腾讯开源的可控性AI图生视频模型

厉飞雨 阅读(727) 评论(0) 赞(18)

<p>MOFA-Video是一种由腾讯A1实验室和东京大学的研究人员共同开源的图像生成视频模型。该技术通过生成运动场适应器将静态图像动画化,从而生成视频。基于预训练的Stable VideoDiffusion模型,MOFA-Video能够通过稀疏控制信号(如手动轨迹、面部标记序列或音频等)实现对视频生成过程中动作的精细控制。这些控制信号不仅可以单独使用,还可以组合使...

让成语故事动起来,用可灵AI制作成语故事短片实例讲解

让成语故事动起来,用可灵AI制作成语故事短片实例讲解

厉飞雨 阅读(1858) 评论(0) 赞(19)

<p>当时为了方便大家制作成语故事短片。我还在智谱清言创建了一个成语绘本智能体&quot;<strong>阿奇成语故事绘</strong> &quot;。只要在对话框中输入成语,这个智能体就会生成:&quot;第一步:成语故事详情-第二步,分镜脚本-第三步,旁白-第四步,绘图提示词-第五步,生成图片&quot;...

10分钟手把手用Coze在家做一整套写真集!(小红书爆火系列)

10分钟手把手用Coze在家做一整套写真集!(小红书爆火系列)

厉飞雨 阅读(463) 评论(0) 赞(20)

> Coze(扣子)真的是一个非常适合将想法快速落地的好工具,我已经用它来做产品的初期设计 前段时间,我在小红书上看到很多使用AI工具为儿童制作写真集的创意案例。这些照片突破了空间限制,展现出各种巧妙的艺术风格,实在令人叹为观止,**吸引了大量的用户关注,这类账号的数据表现整体相当不错,单单一个儿童艺术照主题,就已经造就了许多拥有数万粉丝的博主账号。** ![](htt...