Whisper + Qwen1.5 + ChatTTS 实现完全本地语音聊天机器人
续上一篇《利用 Whisper + DeepSeek + ChatTTS 构建语音对话机器人》。不少同学反馈,调用 DeepSeek v2 API 太慢了,能否换成本地模型。受 RTX 3060 12 GB 显存资源限制,笔者尝试了无数开源模型,要么中文效果不好(LLaMA 3),要么运行发生 OOM,最后瞄准了千问 1.5 系列模型中的 1.8B-Chat 这个模型,跑起来只
续上一篇《利用 Whisper + DeepSeek + ChatTTS 构建语音对话机器人》。不少同学反馈,调用 DeepSeek v2 API 太慢了,能否换成本地模型。受 RTX 3060 12 GB 显存资源限制,笔者尝试了无数开源模型,要么中文效果不好(LLaMA 3),要么运行发生 OOM,最后瞄准了千问 1.5 系列模型中的 1.8B-Chat 这个模型,跑起来只
在这个大数据时代,谁不想让自己的NAS系统更加强大呢?我精选了十款必备NAS软件,旨在帮你充分发挥NAS的价值。无论你是刚开始接触NAS的新手,还是已经是技术达人,这些软件都非常值得尝试。而且好消息是,这些软件支持各种系统,无论是群晖、威联通还是其他NAS设备,都可以安装使用。前言接下来推荐的软件包含下载、影音、私有网盘、私有相册等类型,并且这些软件全部支持Docker安装,基
大家还记得我在之前的文章"AI绘图不再难:MJ绘图万能公式,让小白也能轻松上手"中提到了MJ绘图万能公式。 这个万能公式,也叫做MJ提示词框架结构。它是:"主体+媒介+环境+构图+灯光+风格+氛围+情绪"。 如果你感觉不好记住?那怎么办呢? 你可以想象一下,你现在是在用手机拍照。而拍照的这个过程就和MJ提示...
在当今数字化时代,短视频平台上的内容创作者们不断推陈出新,不仅在内容上进行创新,还在形式上进行了大胆尝试。其中,"注意看,这个男人叫小帅"作为一个短视频解说的经典开头语,为大家所熟知。 然而,随着时间的推移,电影解说形式也在不断升级,不再满足于简单的配音解说,而是尝试用rap的方式来进行电影解说,将原本枯燥的解说提升到了一个全新的境界。 下...
NAS用户有福了!使用Docker搭建个人专属的阅读服务器,实现看书/听书自由 最近有小伙伴问我,NAS上有没有看书的神器,正好我前不久已经在NAS上搭建好了一个非常不错的国人开发的开源免费阅读服务器,名字干脆直接,就叫做『阅读』,在这里分享给大家! 关于『阅读』 简介: 『阅读』是一款国人大佬开发的免费开源的阅读工具,主要是为广大网络文学爱好者提供一种方便、快捷舒适的试读体验
下载歌曲还要什么VIP?教你在NAS上搭建一个高品质音乐下载神器『Musicn』 平时在给小伙伴们分享教程的时候,总有小伙伴在评论区求演示图片中的资源,其中就包括一些音乐资源。 在当下找资源确实是一门技术活,毕竟在版权意识越来越强的今天,资源收费也是情理之中。 不过有些商家利用版权"割韭菜"真的是让人不能忍! So,今天我不会给小伙伴发资源,...
在抖音上看到民间小视频,是不是很想自已动手做一个,但是却苦于无从下手,本篇手把手教你做一个民间故事视频。 操作过程 一、 进入kimi(https://kimi.moonshot.cn/),借助kimi智能助手生成故事文案 prompt: 你是讲民间故事的说书人,博学多才,在抖音上面有亿万粉丝,大家都很喜欢你幽默有趣的风格。现在你要给大家讲"西游记-三大排骨...
在之前的文章:"AI绘图工具实验,"一个女孩"提示词的多样化图片展示",给大家展示了用MJ绘制"一个女孩"的多样化图片。今天应交流群的一位同学要求,给她发了十几个MJ人物绘图的提示词。我在其中选了8个给大家分享出来: 1、Young girl with black gla...
防抖debounce用户在输入框内频繁输入时,默认会被触发多次。如果希望在用户输入后,延迟一定时间的再触发,则可以使用防抖debounce。DEMO:在输入框内输入时,在规定时间(0.5秒)内只触发一次开启防抖前每次输入都会触发开启防抖后输入间隔一段时间后才触发代码:<script src="https://cdn.jsdeli...
背景当通过域名使用一次https访问后,下一次通过域名访问,chrome浏览器会自动跳转到https上,即便删除了缓存也不管用。HSTSHTTP严格传输安全(英語:HTTP Strict Transport Security,缩写:HSTS)是一套由互联网工程任务组发布的互联网安全策略机制。网站可以选择使用HSTS策略,来让浏览器强制使用HTTPS与网站进行通信,以减少会话劫持