首页
友情链接
全景相册
随机剧照
本站声明
壁纸
Search
1
diffusers-image-outpaint,智能扩图工具,懒人包,有更新
8,692 阅读
2
AIGC数字影像馆,键盘摄影大师(一键懒人包)
4,108 阅读
3
Diffusers-Image-Community,AI扩图,新版懒人包
3,173 阅读
4
三款离线OCR对比(供下载)
3,143 阅读
5
台湾-景(阿里山,101,故宫,日月潭)
3,099 阅读
摄影类
茶余饭后
软件类
Search
标签搜索
AI
园博园
五一
锦绣园
甘坑
重庆
大模型
荔枝公园
开源
懒人包
台湾
相机
大梅沙
沙井
大沙河
南头古城
锦绣中华
博物馆
华强北
一个公园
傻木摄影
累计撰写
637
篇文章
累计收到
147
条评论
首页
栏目
摄影类
茶余饭后
软件类
页面
友情链接
全景相册
随机剧照
本站声明
壁纸
搜索到
637
篇与
傻木
的结果
2026-06-23
音频转字幕自动翻译一条龙
音频转字幕自动翻译一条龙 更新 集成了sensevoice-small模型 删除了whisper-large-v3-turbo模型 关于效率 194分钟音频 whisper-large-v3-turbo 114秒 输出字幕 whisper-large-v3 408秒 自带英文字幕输出  API常见的都有,包括两个本地的,以下截图不全  一、软件简介 本工具将文件夹内的音频/视频批量转成 SRT 字幕,可选 API 翻译或 Whisper 内置译英 设置好API服务后,勾选API翻译时,转出字幕会自动翻译成你设置的目标语言,无需其他设置 Whisper 内置译英,无需API设置即可直接将任意语言输出为英语字幕 二、运行前准备 1. 硬件 - 建议使用 NVIDIA 显卡(CUDA),转写速度明显快于 CPU。 - 显存建议 ≥ 6GB(large 级模型量化版约 3GB/路)。 2. 授权 - 首次启动会验证正式授权 license.key 或在线试用(全功能72小时试用)。 - 试用/授权失败时,控制台会显示机器码,需联系我获取授权文件 - 正式版费用说明:200元,在线限时长.350元,离线授权,断网可用 3. 启动方式 - 双击傻木摄影.exe运行 - 控制台出现 http://127.0.0.1:8765/ 后,浏览器会自动打开; 三、界面操作(逐步说明) 【第 1 步】选择音频文件夹 - 在「音频文件夹」输入路径,或点「浏览…」选择。 - 程序只处理该文件夹根目录下的文件,不递归子文件夹。 - 支持格式:.mp3 .wav .m4a .flac .aac .ogg .wma .mkv .mp4 【第 2 步】选择布局(右上角) - 自动:屏幕物理宽度 ≥ 2200px 居中显示,否则全屏 - 标准:固定居中宽度 - 满屏:界面横向铺满 【第 3 步】选择模型 - 在「模型选择」下拉框中选择(见第四节两个模型的区别)。 【第 4 步】调整字幕参数(默认参数已最佳化,不建议调整) - 单条最长:每条字幕最长持续时间(默认 8 秒) - 单条最多:每条字幕最多字数(默认 35 字) - 数值越大,单条字幕越长、行数越少;越小则切分更碎。 【第 5 步】翻译相关选项(可选,见第五节) - 右侧勾选区可配置 API 翻译、双语对照、Whisper 自翻等。 【第 6 步】配置 API(需要翻译时) 1. 展开底部「API 设置」。 2. 填写对应平台的接口地址、API Key、默认模型。 3. 点「测试」,通过后自动打开「翻译可选」开关。 4. 启用后,该提供方会出现在右侧「翻译 API」下拉中。 - 支持:硅基流动、火山、LM Studio、Ollama、DeepSeek、智谱、Moonshot、OpenAI 等。 【第 7 步】开始转写 1. 点「开始转字幕」。 2. 可查看总进度 / 当前文件进度和运行日志。 3. 任务进行中,设置项会锁定,需等全部完成后才能更改。 【第 8 步】查看结果 - 字幕默认保存在音频同目录,文件名与音频一致。 - 若有失败,文件夹内会生成「失败记录.txt」。 - 若勾选了自动翻译,则会生成_en字幕或者_all字幕文件 四、两个模型的区别与选用建议 程序内置两个 opeai/Whisper 模型,路径均在 py/openai/ 下: 对比项 Whisper large v3 turbo(默认) Whisper large v3 ----------------------------------------------------------------------- 模型 ID openai/whisper-large-v3-turbo openai/whisper-large-v3 速度 更快,适合大批量 相对较慢 转写质量 优秀,日常听书/播客推荐 长音频时间轴更稳 Whisper 原生译英 不支持(无翻译训练) 支持 「自翻」选项 不可用 可用 「仅英文」选项 不可用 可用 推荐场景 只要原语言字幕、追求速度 要中英双轨或 Whisper 译英 【各自怎么用?】 场景 A:只要原语言字幕(最常见) 1. 选 Whisper large v3 turbo 2. 不勾选任何翻译选项 3. 开始转写 → 得到 文件名.srt 场景 B:要原语言 + 英文(Whisper 自己译) 1. 选 Whisper large v3 2. 勾选「自翻」 3. (可选)勾选「中英」或「英中」生成对照字幕 4. 得到: - 文件名.srt(原语言) - 文件名.en.srt(英文) - 文件名_all.srt(双语对照,若勾选了中英/英中) 场景 C:只要英文字幕(Whisper 译英) 1. 选 Whisper large v3 2. 勾选「仅英文」 3. 得到 文件名.srt(内容为英文) 场景 D:turbo 转写 + API 翻译任意语言 1. 选 Whisper large v3 turbo(或 large v3 均可) 2. 勾选「API翻译」 3. 选好翻译 API、源语种、目标语种 4. 得到: - 文件名.srt(原语言) - 文件名.en.srt(或 文件名.目标语种代码.srt) - 文件名_all.srt(若勾选中英/英中) 五、翻译选项说明 以下选项互斥,同时只能开一种主模式: 选项 作用 适用模型 ----------------------------------------------------------------------- API翻译 转写完成后,用 LLM API 翻译整份字幕 任意 中英 双语合并,源语种在上、译文在下 → *_all.srt 配合 API翻译 或 自翻 英中 双语合并,译文在上、源语种在下 → *_all.srt 同上 自翻 Whisper 先转写再译英,输出 .srt + .en.srt 仅 large v3 仅英文 Whisper 直接译英,只输出 .srt(英文) 仅 large v3 源语种:选「自动」时由 Whisper 检测;也可手动指定(如中文音频选 zh)。 六、输出文件一览 以音频「播客第1集.mp3」为例: 文件名.srt 主字幕(原语言,或「仅英文」时的英文字幕) 文件名.en.srt 英文字幕(自翻 / API 译英时) 文件名.zh.srt 等 API 翻译到其它语种时(扩展名为语种代码) 文件名_all.srt 双语对照(勾选中英/英中时) 失败记录.txt 批量任务中有失败项时生成 主角光环.txt 输入文件(可选,见下) 七、进阶功能 1. 主角光环(同音字纠错) 在音频文件夹内新建「主角光环.txt」,每行一个正确人名,例如: 张璐 李明 转写时会自动把同音错字替换为正确名字。 例如,某小说音频主角名称为张露 模型转写时可能会随机出现张禄,张璐,章录,脏路等等同音字 对于模型来说,这些都是对的,因此做了「主角光环.txt」 本程序会自动纠偏,最终输出结果时会输出报告  2. 设置自动保存 界面设置会写入 Sam.json(模型、文件夹、字幕参数、API 配置等), 下次启动自动恢复。 八、注意事项(重要) 1. 文件夹必须真实存在,且内含支持的音频文件。 2. 任务进行中不能切换模型、改路径或 API,需等待完成。 3. 仅扫描当前文件夹一层,子目录内音频不会被处理。 4. turbo 不支持 Whisper 自翻/仅英文;需要这些功能必须切换到 large v3。 5. API 翻译需先测试通过并开启「翻译可选」,否则下拉框无可用 API。 6. 授权与硬件绑定;更换主板/CPU/网卡可能导致授权失效,需重新申请。 7. 显存不足时可能报错或极慢;可关闭其它占 GPU 的程序后重试。 8. 如果事先知道音频时中文还是英文,应该在源语种选择好语种 9. 不限制音频时长,单音频16小时,5090 输出字幕时长约7分钟 链接: [https://pan.baidu.com/s/1eBMEm1nCUenbw6FYsst0nA?pwd=gpcb](https://pan.baidu.com/s/1eBMEm1nCUenbw6FYsst0nA?pwd=gpcb)
2026年06月23日
28 阅读
0 评论
0 点赞
2026-06-22
Spyder平替全自动校色
不要脸的苹果想必大家已经见识过了 但是没脸的Spyder想必你们还没见识过  以安全为名,直接禁用用户的设备,强制让用户升级!!!! 你们见过吗????? 真他妈的没脸 这辈子再也不会买他们家的设备了  老子的设备跟新的一样,草泥马 直接给禁用了 谁他妈的给你的底气啊 草泥马  花了两天,写了个全自动校准软件 使用DisplayCAL作为基础,py全自动流程 全程只有三步 1 黑校准,基础步骤 2 放到显示器 3 手动调整显示器亮度 之后就是全自动直至结束 最后会输出.icm 配置文件 目前尚在最终测试中,测试完成后会提供下载 经历诸多磨难,终于搞定 如果提示无法安装驱动,请点右键,以管理员身份运行 有可能安装完驱动会闪退,再次运行即可 插上校色器,再运行本软件 这个驱动与官方Spyder驱动不一样的 也不依赖官方软件 [https://abpyu.lanzoul.com/iKxjD3smvp4j](https://abpyu.lanzoul.com/iKxjD3smvp4j) 校色完成后,会自动打开一个文件夹,icm 就是矫正曲线文件 安装LUTManager_setup_1.1.0.38.msi 并使用汉化补丁替换到原程序 加载刚刚生成的icm曲线即可 
2026年06月22日
18 阅读
0 评论
0 点赞
2026-06-20
人前一套,背后一套
人前一套,背后一套 端午放假没事做,做了个app 安卓的 主要是给照片套滤镜 这就是所谓的,人前一套,背后一套 不提供下载,仅供自用 常见的调整工具都有 自用很是方便 至少没有什么广告之类的 内置精心挑选的一百多种滤镜 涵盖各个场景 例如风景,人像,食物小品等等 
2026年06月20日
14 阅读
0 评论
0 点赞
深圳图书馆一日游
周日天气不好,下雨 原本计划周六下午去的 因故没去 外面下着雨 实在不想冒雨出去 闹钟一再推迟出门 楼上装修叮叮咚咚 实在受不了 还是出去走走 紧赶慢赶 终于赶在美术馆禁止参观前到了 美术馆这期没什么好看的 半个钟就逛完了 去隔壁图书馆走走 好一个班味十足的图书馆 书真他妈的多....
2026年06月16日
19 阅读
0 评论
0 点赞
2026-06-16
WEB视频处理专家
本项目基于以下开源项目二次优化 [https://github.com/tejaswigowda/ffmpeg-webCLI](https://github.com/tejaswigowda/ffmpeg-webCLI)  双击运行自动打开浏览器,基于浏览器简单的编辑视频 [https://abpyu.lanzoul.com/izcWa3rzissf](https://abpyu.lanzoul.com/izcWa3rzissf) 密码:5k5c
2026年06月16日
26 阅读
0 评论
0 点赞
2026-06-13
今天可以放假吗
我们今天可以放假吗? 所以,我们似乎正处于全球白领劳动力(以及很大一部分美国劳动力)生产力革命的开端。 人工智能将彻底改变我们的工作方式、与世界互动的方式、学习方式、社交方式等等。 这听起来很棒。 的确如此。 一切都变得更快更便捷,对我们所有人来说都将是莫大的福音。 那我们能放一天假吗? 如果人工智能能够使我们的生产力全面提高 10 倍, 那就意味着我应该能够在周一中午之前完成以前需要一整周才能完成的工作量。 那我周五可以休息吗? 从现在开始,我周一、周二、周三、周四上班,周五休息。 我们甚至可以把周五定为“AI员工日”; 我保证周四会拼命写出高质量的题目,然后周五经纪人就可以全天使用这些题目了。 这样一来,你们周五也几乎没损失什么时间,对吧? 当然,这适用于所有人。 所以,各位董事会成员和高管们,你们周五可以休假去高尔夫球场打满18洞。 想想都觉得美妙,不是吗? 你们不用待在办公室,因为我也不在。 你们不用待在办公室,因为人工智能代理在那里。 我也不用! 仅仅多一天而已。 考虑到人类生产力各个领域发生的巨大变革,这似乎合情合理,而且确实只是一个很小的改变。 (嘿,埃隆:我正在努力提高生育率。 在加州,三个小孩的托儿费一个月要六千美元。 我这周必须五天都去办公室吗? 为什么不去四天?) 文章提出一个问题:AI 大大提高了白领工作的效率,以前一周的工作,现在几个小时就能完成,那么可以放假一天吗? 这个建议完全是合理的逻辑。 既然更少的时间完成了同样的工作,那么放假对公司并没有损失。 反而,要是不放假,也不加薪,那么 AI 对员工的意义是什么? 除了员工因为 AI 有了更多的工作技能和成果,我认为,一个可能的答案是: AI 提高了全社会的生产效率,这意味着长期中,所有工作岗位的 平均薪资(或福利) 是提高的。 本文转载 [https://mlsu.io/posts/day-off/](https://mlsu.io/posts/day-off/) 
2026年06月13日
16 阅读
0 评论
0 点赞
2026-06-09
超级防火墙
超级防火墙 开发难度远超预期 尤其是在后期测试时 各做逻辑处理,异常艰难 尚在测试中,目前不提供下载 干啥用的? 作为服务器杀毒软件的补充 也可以用在长期不关机的电脑作为防火墙 会自动拉取系统中的日志 主要拦截异常登陆的IP地址 有两个规则, 1 短时间内连续登陆了2次立即拉黑这个IP 2 一段时间内多次错误的登陆4次,拉黑这个IP 这些都是可以设置的,最后一次为拉黑截止数,例如第二条这个4,前面允许三次,第四次时立即拉黑 自带拉黑某个程序禁止出站 或者是载入某个目录,会自动分析这个目录中的文件特征,将可疑程序全部加入到禁止出站 还可以手动添加黑名单白名单等等 已添加不登陆自动后台执行,即加到计划任务中,电脑重启后,没有登录桌面,依然可以在后台运行 需要管理员权限 还自带了4条比较常用的耻辱墙IP库,近5万条不良记录的IP地址 可以一键加入到防火墙中的禁止入站规则中 当然,如果你有更好的连接,可以分享给我
2026年06月09日
43 阅读
0 评论
0 点赞
2026-06-04
你喜欢空格还是tab?
前段时间,微软退役老兵Raymond Chen在他的博客上翻出了一段旧事: 当年微软和IBM合作开发OS/2操作系统时,两边因为一个按键吵了起来。  cp-emoji-021 在对话框里,用户按哪个键从一个输入框跳到下一个?微软说用Tab,IBM不同意,然后一级一级往上升级,升了七层,一直升到副总裁,要求微软也派同级别高管来确认。 微软这边回了一句:"Bill Gates's mother is not interested in the TAB key." 意思是比尔·盖茨上面就剩他妈了,难道比尔·盖茨他妈也要来讨论 Tab 键吗? 一个按键而已,能让两家巨头公司闹到高管对线。 cp-emoji-061 但实际上,相比"Tab要不要用来切换字段"这种小打小闹,围绕它还有一场更大的战争:写代码的时候,缩进到底该用Tab,还是用空格? 这问题听着跟"你吃饭用左手还是右手"一样无聊。但就这么个破事儿,全世界最聪明的一帮人,为它撕了整整半个世纪。甚至比冯诺依曼派和图灵派的吵吵还要早。 因为这事儿,得从打字机说起。Tab键最早在打字机上就有了,本职就是替空格干缩进的活,省得打字员一格一格戳到手腕报废。 但到了计算机时代,存储是按KB的。同样缩进4层,空格要16个字符,Tab只要4个,省出来的全是白花花的银子。 cp-emoji-049 所以早期终端直接把Tab定成8个字符宽。从1969年的TOPS-10到1974年的VT52,Tab永远8个字符宽。甚至在ASCII里, Tab 和 Space 也有着完全不同的定义,一个是控制字符,另一个是可打印字符,老祖宗定的规矩,没的商量。 直到1978年,VT100终端把Tab宽度第一次变成了可以自定义的,这下坏了。  因为大家很快就发现,我擦,你的Tab是4个字符宽,我的是8个,他的是2个。你电脑上排好的代码,到我屏幕上一开就全乱了,那找谁说理去? 所以为了应对混乱的Tab字符,空格党正式登上了舞台,因为他们的论据非常简单白给:"用空格,到哪儿都一样啊。" cp-emoji-047 本来吧你乐意用tab就用,喜欢到哪儿都一样就用空格,也没人拦着。但真正把技术分歧升级成宗教战争的,是因为两个男人堂堂登场。 第一位上场的选手,就是鼎鼎大名的Linux之父:莱纳斯·托瓦兹。 这老小子不仅是Tab党,而且是纯纯的原教旨主义者,毕竟Linux内核编码规范的第一章,就是这么写的: "制表符是8个字符,因此缩进也是8个字符。有些异端运动试图将缩进设为4个甚至2个字符深,这无异于试图将圆周率定义为3。" cp-emoji-067 这尼玛,敢情人家空格党要有两栋高楼,他得是恨不得亲自开飞机的那种。 但人家这倒也不是在耍流氓。他的逻辑是:8字符缩进,一行80个字符就满了,你最多嵌套3层,超过3层说明代码写烂了啊。你的代码缩进到第四层出了问题,那不是Tab的问题,是你的问题。 所以有句名言至今流传:"如果你的代码需要超过3层缩进,那你已经完蛋了,去修你的程序吧。" 但问题是,空格党也有高手。这边派出的就是:Python之父,吉多·范罗苏姆。 和Linux相比,这哥们就走了完全相反的路,Python把缩进变成了一种语法。 cp-emoji-039 你不缩进,代码就跑不了,因为解释器靠数你每行前面有几个空白字符来判断代码结构,如果团队里有人用Tab有人用空格,那直接就报错了。 实际上,吉多早期其实也想推Tab,但社区反馈实在是一言难尽。 跟前面的终端问题类似,由于不同编辑器对Tab转空格的默认行为完全不一样,你的代码一跨平台就直接炸了。 cp-emoji-036 所以为了保全自己的户口本不被社区Aoe,最终他决定:所有人全部用4个空格,不许混用! 紧接着他制定的PEP 8也成了Python宪法,空格也就成了Python党的绝对信仰。 其实本来吧,同样是为了解决代码问题,一个是用暴力缩进倒逼代码架构,一个用绝对空格换取跨平台安全。底层逻辑都差不多,但思路不一样,结果就大有不同。 再加上两方大佬站台,就跟封神榜似的。元始天尊通天教主都发话了,那还说啥了。 cp-emoji-057 于是从上世纪末到最近几年,这tab党和空格党就跟阐教截教一样,大家就互殴吧。 举个例子,在HBO神剧《硅谷》里,男主发现女朋友用空格,当场就崩溃了冲出家门,破口大骂说"我绝不可能和一个用空格代替制表符的人在一起。" 啧啧,这剧组技术顾问是Google的开源总监,这段的灵感还真就来自程序员的真实吐槽。 cp-emoji-029 还有在2017年,Stack Overflow的数据科学家也是看热闹不嫌事大,直接拱火说哥们分析几十万份数据后发现,用空格的程序员平均薪资比用Tab的高8.6%,这事还上了BBC。 你们空格党怎么还薪资歧视啊喂!职场霸凌! 不过后来真相查明出来,不是用空格让你变有钱了,而是有钱的公司逼你用空格。 cp-emoji-040 因为高薪群体大多供职于工程规范严格的大厂,在几百人协作的代码库里,空格的"绝对一致性"确实最省心。 说白了,缩进方式本质上是个变量,代表的不是编程能力,而是你所处的工程环境有多成熟。 那么讲到这,那最后空格党和tab党谁赢了呢? 直接说结论,虽然没分出胜负,但是tab党在道德上占据了上风。 这倒不是因为它根正苗红,而是一群大家压根没想过的人:盲人程序员。 cp-emoji-033 由于他们靠盲文显示器写代码,盲文面板通常只有40个字符格。4空格缩进嵌套3层就是12格,那么30%的物理空间就浪费在空白上,手指摸一圈发现没摸到多少代码内容。而Tab一层只占一格,3层嵌套就3格。 所以这下,Tab在道德层面就直接封神了,因为空格党追求的"一致性",本质上假设每个人都有完美视力和标准显示器,但世界上还有很多人不是这样的。 但空格党也没有因此投降,毕竟装个适配插件就能折叠空格缩进的事,技术问题终归可以用技术解决。 cp-emoji-014 同样的,随着2017年EditorConfig、Prettier 这类格式化工具的出现,这些手工敲代码的争论也被技术改进逐渐平息。这些工具默认不用 Tab,但也支持,并且会用 Tab 缩进、空格对齐的 SmartTabs 思路。 所以空格还是tab,越来越变成了一种文化上的身份认同。 弗洛伊德1917年提出过一个概念,叫"微小差异的自恋"。 说两个群体越相似,越会对彼此一丁点不同的地方抓狂。所有程序员面对的压力几乎一样:改不完的需求、查不尽的Bug、半夜三点的报警,发际线曲线都高度重合。正因为太像了,才需要找一个微小差异来证明——"我跟你不一样"。 无论是简约头像还是动漫头像,格子衫还是女装,Tab还是空格,这都早就不是工程决策了,本质是极客世界里的部落图腾。 这种古已有之的争论,靠人类自己,是永远分不出胜负的。 撰文:纳西 编辑:江江 & 面线 美编:素描 图片、资料来源: the register,Github等,部分图源网络 本文转载 [https://mp.weixin.qq.com/s?__biz=MzA5NDc1NzQ4MA==&mid=2654665433&idx=2&sn=ee65762e28971b03d94a38d1c40b3315&chksm=8a88dec1f22a671b3c43cc794652e83964d7ed07ba84a3c469d0bb4ca2db454fb60f56b5e7a3&scene=27](https://mp.weixin.qq.com/s?__biz=MzA5NDc1NzQ4MA==&mid=2654665433&idx=2&sn=ee65762e28971b03d94a38d1c40b3315&chksm=8a88dec1f22a671b3c43cc794652e83964d7ed07ba84a3c469d0bb4ca2db454fb60f56b5e7a3&scene=27)
2026年06月04日
38 阅读
0 评论
1 点赞
1
2
...
80
网站版权本人所有,你要有本事,盗版不究。 sam@gpcb.net