首页
友情链接
全景相册
随机剧照
本站声明
壁纸
Search
1
diffusers-image-outpaint,智能扩图工具,懒人包,有更新
7,932 阅读
2
AIGC数字影像馆,键盘摄影大师(一键懒人包)
3,711 阅读
3
台湾-景(阿里山,101,故宫,日月潭)
2,937 阅读
4
三款离线OCR对比(供下载)
2,921 阅读
5
九寨沟
2,781 阅读
摄影类
茶余饭后
软件类
登录
Search
标签搜索
AI
园博园
锦绣园
五一
甘坑
重庆
大模型
荔枝公园
开源
懒人包
台湾
相机
大梅沙
沙井
大沙河
南头古城
锦绣中华
博物馆
一个公园
卡点
傻木摄影
累计撰写
599
篇文章
累计收到
134
条评论
首页
栏目
摄影类
茶余饭后
软件类
页面
友情链接
全景相册
随机剧照
本站声明
壁纸
搜索到
136
篇与
» 软件类
的结果
2025-05-16
IndexTTS: 可控高效语音合成系统,一键懒人包,自媒体配音神器
IndexTTS: 可控高效语音合成系统,一键懒人包,自媒体配音神器 之前测试过好几个类似的软件 都没有这个好,可以听听下面这段音频,停顿以及语气,是不是与原装无异? 本站不是什么正经网站,我也不是什么正经人,你也不用一本正经的全都看完。本站发布的软件使用起来都是及其简单,饭盛碗里递你手上了,筷子递你手上了,怒不提供喂饭服务,不会用也不用留言问,请自己琢磨研究。实在不会用,请删除。看见官方有更新的,也不用催更,只做我想做的。 本站是我私人的自留地,我所说的都是我想说的,合法且不会触及我的道德底线。如果触及了你的心理防线,我建议你将这条线拉高一点。如果你是我同事,看见了你不想看见的内容,请你装作没看见,也不用给我留言。这是我唯一可以肆无忌惮倾诉的地方,请给我留一条活路! 默认是静音的,点下喇叭图标开启 [影音片段: 请查看原文播放] jian27打包,更新地址 https://www.jian27.com/html/624.html 在他打包基础上,本站进行了负优化 减少了体积,压缩包原先4.6gb,负优化后4.2gb 原先输出wav音频格式,已改成MP3 简化了目录结构,原先目录较乱,现在目录结构如下  还有其他一些优化 本工具如果用来转换大段文本,效率是比其他软件低很多的 原因是本软件拆字断句与其他软件截然不同,本软件几乎是逐字拆句的 好在最终效果比其他软件输出的效果好 例如千字左右段落约需要4分钟左右 占用显存7gb左右 百度网盘,回复后刷新可见 隐藏内容,请前往内页查看详情
2025年05月16日
479 阅读
1 评论
2 点赞
2025-04-30
DeepSeek本地部署一键运行DeepSeek-tool v10+Qwen3-30B-A3B
DeepSeek本地部署一键运行DeepSeek-tool v10+Qwen3-30B-A3B Qwen3前几天发布了 群里打包了懒人包 升级了llama,我替换了模型 内置的模型只有一个Qwen3-30B-A3B 需要12gb黄皮显卡 少于12gb的可以下载jian27版本  默认的管理员账号是jian27@126.com 和123@123.com 密码1234 进去后 自行修改 [转载自jian27 ](https://www.jian27.com/html/1396.html) 百度网盘下载链接,回复后刷新可见 11.95gb 隐藏内容,请前往内页查看详情
2025年04月30日
304 阅读
1 评论
0 点赞
2025-03-06
Spark-TTS,极简版音频克隆
Spark-TTS,极简版音频克隆 干啥的? 如果你是播客,经常在b站发视频解说之类的 可以录制一段你说话的录音 然后输入一段文本,生成音频,用你的音色生成一段音频 你还可以叫猪八戒给你讲故事 等等等等 使用方法非常简单 上传一段参考音频或者录制你自己的声音 输入你想转换成音频的文本 点击开始克隆即可 Spark-TTS是一款先进的文本转语音(Text-to-Speech,TTS)系统, 它利用大型语言模型(Large Language Model,LLM)的强大功能,实现了高度准确且自然流畅的语音合成。 该系统旨在为研究和生产使用提供高效、灵活且强大的解决方案。 Spark-TTS的核心优势在于其简洁性和效率。 它完全基于Qwen2.5构建,无需额外的生成模型,如流匹配模型等。 这一设计使得Spark-TTS能够直接从LLM预测的代码中重构音频,从而简化了流程,提高了效率,并降低了复杂性。 这种创新的方法使得Spark-TTS在语音合成领域具有显著的优势。 此外,Spark-TTS还支持零样本语音克隆(Zero-Shot Voice Cloning), 这意味着它可以复制说话者的声音,而无需为该声音提供特定的训练数据。 这一功能在跨语言和代码切换场景中尤为有用,它允许Spark-TTS在不同的语言和声音之间无缝切换,而无需为每个语言或声音分别进行训练。 Spark-TTS还支持中文和英文,这使得它能够在多种语言环境中提供高质量的语音合成服务。 同时,通过调整参数如性别、音调和语速等,Spark-TTS还可以创建虚拟说话者,为用户提供更加个性化的语音合成体验。 然而,需要注意的是,Spark-TTS主要用于学术研究、教育目的以及合法应用,如个性化语音合成、辅助技术和语言学研究等。 用户在使用时应遵守当地法律法规和道德规范,不得将Spark-TTS用于未经授权的语音克隆、冒充、欺诈、诈骗、深度伪造或任何非法活动。 jian27打包 [https://www.jian27.com/html/1459.html](https://www.jian27.com/html/1459.html) 我在jian27打包基础上进行了二次负优化 将我不需要的web界面进行了删减 删减了原包中用不上的文件,压缩包整体进行了减肥(原作 5.99gb,本站负优化后,4.11gb) 修复了一个致命bug 当文本输入框中有回车换行时,原作只会生成第一句,剩下的都舍弃了 本站所发的版本已经修复该问题,回车也不影响音频生成 另外还加了显存回收 效果的话,大概能达到原音参考音频的7成左右 某些时候转换出来的音频会语速较快 需要黄皮显卡,显存4gb以上即可 推荐6gb以上显卡  回复后,刷新可以看见下载链接 隐藏内容,请前往内页查看详情
2025年03月06日
903 阅读
2 评论
0 点赞
2025-02-25
FunASR-webui,音频转成文本
FunASR-webui 用于将音频转成文本 例如会议录音转成文字记录 mp4视频文件转换成字幕文件等等 运行界面如下 加载音频或者MP4文件 点击开始按钮 耗时视音频长度而不一 效率还是很高的 转换完成会在out目录自动保存为三个格式 一个txt,一个视频字幕文件,一个音频歌词格式文件 消耗显存约2.5gb左右 转载于 B站十字鱼 [https://www.bilibili.com/video/BV193AfenEiv/?spm_id_from=333.1387.homepage.video_card.click](https://www.bilibili.com/video/BV193AfenEiv/?spm_id_from=333.1387.homepage.video_card.click) 作者的开源页面 [https://github.com/gluttony-10/FunASR-webui](https://github.com/gluttony-10/FunASR-webui) 本站独家负优化 显著减少体积,压缩包3.2gb(原作5.4gb) web界面简化  百度网盘下载链接,回复后刷新可见 隐藏内容,请前往内页查看详情
2025年02月25日
1,153 阅读
2 评论
0 点赞
2025-02-24
傻木摄影_文件批量重命名
傻木摄影_文件批量重命名 顾名思义 用来批量重命名文件的 这个工具是易语言写的 可能会报毒 这是我用过最好的重命名工具 不是因为我写的 而是很多细小功能都是根据我自身需求而改的 大多数操作不需要键盘输入 载入需要重命名的文件夹 选择一个文件 会显示旧文件名 在旧文件名中选择需要替换的部分 会自动粘贴到“原文件名” 此时点击重命名,则会将该文件夹中的所有文件包含“原文件名”的内容删除 如果选择了文件目录中的文字,则会自动粘贴到“替换件名”替换文件名中 此时点击重命名,则会将“原文件名”的内容批量替换成“替换件名” 右键点击文件目录,会自动打开该目录 可以批量加前缀 可以批量加后缀 可以有条件重命名(例如删除左起几位,右起几位等等) 可以满足日常绝大部分重命名需求 已经足够简单 更多功能自己摸索  软件回复刷新,可见下载链接 隐藏内容,请前往内页查看详情
2025年02月24日
319 阅读
0 评论
1 点赞
2025-02-21
Deepseek本地部署(内置32B和14B模型)2月21更新
首次使用需要联网下载 install open-webui 组件(过程是自动的) 之后就不用联网了 deepseek本地部署由剑二十七制作分享 更新地址 https://www.jian27.com/html/1396.html (此版压缩包40gb+) 以下本站独家负优化(优化后带两个模型总体积14.4gb) 模型已替换为 Q2量化版,显存占用大幅降低,6gb以上黄皮显卡可玩 在显存不够情况下,优先选择降低精度且模型体量大的 例如14b Q2量化版,远比8B fp16好的多 就好比人家说砒霜有毒会毒死人 0.000000000000000000000001毫克砒霜也是砒霜,我不相信能毒死我 在体量面前谈量化,那就是扯淡 模型只保留了14b和32b,14b 实际运行占用5.5gb显存,32b占用约11gb显存 可以自己替换喜欢的模型,原则上gguf后缀的模型都可以,例如有些无限制模型等等 怎么替换请自行研究,不做解答 默认的管理员账号是jian27@126.com 或者 123@123.com 密码都是 1234 进去后 自行修改 刚刚更新的版本只是优化了根目录,看起来更简洁,更适合强迫症患者   [另附DeepSeek从入门到精通.pdf https://abpyu.lanzoul.com/ieqGO2nk1gsb](https://abpyu.lanzoul.com/ieqGO2nk1gsb) 首次启动时,点击开始使用  输入昵称(随便输) 默认账号是 123@123.com 密码都是 1234 进去后 可以自行修改 这一步可能会白屏,浏览器什么都没显示,这一步别急,大约需要等几秒钟   视你电脑硬件情况,选择模型,一般8gb以下N卡选择14b即可,最低显存要求6gb就能跑14b 12gb以上显存可以跑32b 右上角有详细设置,还有账户设置等等 可以设置联网搜索,这个需要申请API,属于各家搜索引擎收费项目,不是本项目要收费 更多好玩的,请自己摸索  通过百度网盘分享的文件:DeepSeek-tool_V3.03.7z 回复后,刷新可见下载链接 隐藏内容,请前往内页查看详情
2025年02月21日
2,379 阅读
8 评论
5 点赞
2025-02-13
Sonic,一键包,数字人工具,音频驱动图片说话,腾讯联合浙大开源
Sonic,一键包,数字人工具,音频驱动图片说话,腾讯联合浙大开源 用人话介绍: 给一张图片,给一段音频,然后他会根据音频内容让图片转成视频并配合音频调整嘴型以及面部生态 [转载自B站十字鱼](https://www.bilibili.com/video/BV1bjFLe7EZd/?spm_id_from=333.1387.homepage.video_card.click&vd_source=593137df0281be7bde42cb018cfaedab) 官方项目地址 [https://github.com/jixiaozhong/Sonic](https://github.com/jixiaozhong/Sonic) 本站负优化 首先减肥2gb 汉化界面 删除了页面多余的示例 优化了文件目录,看起来更清爽 增加了显存回收 效果图  完整界面  链接: [https://pan.baidu.com/s/1G1Hl3DFqJq8ObnA2ujNRbQ?pwd=gpcb](https://pan.baidu.com/s/1G1Hl3DFqJq8ObnA2ujNRbQ?pwd=gpcb)
2025年02月13日
350 阅读
0 评论
0 点赞
1
...
4
5
6
...
20
网站版权本人所有,你要有本事,盗版不究。 sam@gpcb.net