51工具盒子

依楼听风雨
笑看云卷云舒,淡观潮起潮落

软件教程

阿里通义音频生成大模型 FunAudioLLM 开源!

阿里通义音频生成大模型 FunAudioLLM 开源!

厉飞雨 阅读(117) 评论(0) 赞(5)

01 导读 人类对自身的研究和模仿由来已久,在我国2000多年前的《列子·汤问》里就描述了有能工巧匠制作出会说话会舞动的类人机器人的故事。声音包含丰富的个体特征及情感情绪信息,对话作为人类最常使用亲切自然的交互模式,是连接人与智能世界至关重要的环节。 近日,阿里通义实验室发布并开源了语音大模型项目FunAudioLLM,旨在深化人类与大型语言模型(LLMs)之间的自然语音交

记录:MSVC+Qt生成dump文件

记录:MSVC+Qt生成dump文件

厉飞雨 阅读(99) 评论(0) 赞(5)

本文只是记录下 MSVC+Qt 生成 dump 的代码。 dump 文件能够保存程序内部的内存、堆栈、句柄、线程等程序运行相关的信息,当程序异常无法在调试环境里解决时,dump 文件是分析问题的重要手段。 相关 win API 文档可以在 MSDN 查看:https://docs.microsoft.com/zh-cn/search/?terms=MiniDumpWriteDu

【干货】快速开始Photoshop之旅(三):一寸照排版

【干货】快速开始Photoshop之旅(三):一寸照排版

厉飞雨 阅读(115) 评论(0) 赞(4)

今天我们厉害了,来学习一下如何进行一寸照的修饰和排版! 生活中常常有急需一寸照片而又来不及拍摄的情况,这时如果能够使用Photoshop将已有照片修改为一寸照并打印出来,将会十分方便我们的生活。在本例中,将使用普通照片制作一寸照片,并进行排版,效果如图所示。 如何做到的呢,我们仍旧以一个案例进行说明 第一步,Ctrl+O打开我们的素材,使用工具箱中的矩形选框工具,选择人物的头

阿里开源语音大模型:语音识别效果和性能强于 Whisper,还能检测掌声、笑声、咳嗽等!

阿里开源语音大模型:语音识别效果和性能强于 Whisper,还能检测掌声、笑声、咳嗽等!

厉飞雨 阅读(98) 评论(0) 赞(4)

语音识别技术在人工智能(AI)领域扮演着至关重要的角色,它不仅是人机交互的基石,也是推动智能系统发展的关键驱动力。以下是语音识别在AI领域的一些主要作用: 改善用户体验:通过语音识别,用户可以与智能设备进行自然语言交流,无需手动输入,这极大地提升了用户体验的便捷性和直观性。 数据收集与分析:语音识别可以自动转录语音数据,为企业提供大量的自然语言数据,这些数据可用于市场研究、消

图片直接生视频:腾讯开源的可控性AI图生视频模型

图片直接生视频:腾讯开源的可控性AI图生视频模型

厉飞雨 阅读(99) 评论(0) 赞(4)

MOFA-Video是一种由腾讯A1实验室和东京大学的研究人员共同开源的图像生成视频模型。该技术通过生成运动场适应器将静态图像动画化,从而生成视频。基于预训练的Stable VideoDiffusion模型,MOFA-Video能够通过稀疏控制信号(如手动轨迹、面部标记序列或音频等)实现对视频生成过程中动作的精细控制。这些控制信号不仅可以单独使用,还可以组合使用,以零样本(ze

【干货】快速开始Photoshop之旅(六):让图像亮起来!

【干货】快速开始Photoshop之旅(六):让图像亮起来!

厉飞雨 阅读(49) 评论(0) 赞(4)

今天我们厉害了,说一说校正图像曝光与色彩,让图像亮起来! 对摄影来说,除了环境、人物以外,光线也是必不可少的外界条件之一。光线可以直接影响色彩,室内摄影可以人工补光,外景摄影中光线的调整性就比较被动了。Photoshop拥有强大的图像调色功能,可以有效地改变局部和整体色彩,使图像"变废为宝"。作为设计师,无论身处哪个领域都要熟练掌握Photo...

45-个人认为设计的最好的结构之一,音视频类结构体参数的设计,说来惭愧,首次大规模应用结构体。

45-个人认为设计的最好的结构之一,音视频类结构体参数的设计,说来惭愧,首次大规模应用结构体。

厉飞雨 阅读(52) 评论(0) 赞(4)

一、前言 视频监控内核组件重构和完善花了一年多时间,整个组件个人认为设计的最好的部分就是各种结构体参数的设计,而且分门别类,有枚举值,也有窗体相关的结构体参数,解码相关的结构体参数,同时将部分常用的结构体参数的获取和设置单独提供了函数,参阅海康大华等大厂的sdk的设计方式,也是将众多的参数统一归类的不同的结构体中,这样后期非常容易就能拓展,比如又新增一个参数,只需要动结构体就行

盘点:免费开源WMS仓储管理系统,7个

盘点:免费开源WMS仓储管理系统,7个

厉飞雨 阅读(97) 评论(0) 赞(4)

ModernWMS 详细介绍: ModernWMS是一款专为仓库管理设计的开源系统,它基于多年的ERP项目实施经验而开发,去除了商业系统中不必要的复杂功能,专注于仓库管理的核心需求。 该系统支持跨平台使用,无论是Window

让成语故事动起来,用可灵AI制作成语故事短片实例讲解

让成语故事动起来,用可灵AI制作成语故事短片实例讲解

厉飞雨 阅读(138) 评论(0) 赞(4)

在我公众号以前的文章中,是有专门为大家讲解过用AI工具制作成语故事短片的。没看过的,可以点击查看这篇文章:让成语故事活起来:用AI工具制作绘本视频实例讲解。 当时为了方便大家制作成语故事短片。我还在智谱清言创建了一个成语绘本智能体"阿奇成语故事绘"。只要在对话框中输入成语,这个智能体就会生成:"第一步:成语故事详情-第二步,...

10分钟手把手用Coze在家做一整套写真集!(小红书爆火系列)

10分钟手把手用Coze在家做一整套写真集!(小红书爆火系列)

厉飞雨 阅读(93) 评论(0) 赞(4)

Coze(扣子)真的是一个非常适合将想法快速落地的好工具,我已经用它来做产品的初期设计 前段时间,我在小红书上看到很多使用AI工具为儿童制作写真集的创意案例。这些照片突破了空间限制,展现出各种巧妙的艺术风格,实在令人叹为观止,吸引了大量的用户关注,这类账号的数据表现整体相当不错,单单一个儿童艺术照主题,就已经造就了许多拥有数万粉丝的博主账号。 图:小红书搜索创意儿童AI写真