首页
友情链接
全景相册
随机剧照
本站声明
壁纸
Search
1
diffusers-image-outpaint,智能扩图工具,懒人包,有更新
8,205 阅读
2
AIGC数字影像馆,键盘摄影大师(一键懒人包)
3,833 阅读
3
台湾-景(阿里山,101,故宫,日月潭)
2,995 阅读
4
三款离线OCR对比(供下载)
2,973 阅读
5
九寨沟
2,812 阅读
摄影类
茶余饭后
软件类
Search
标签搜索
园博园
AI
锦绣园
五一
甘坑
重庆
大模型
荔枝公园
开源
懒人包
台湾
相机
大梅沙
沙井
大沙河
南头古城
锦绣中华
博物馆
一个公园
卡点
傻木摄影
累计撰写
611
篇文章
累计收到
135
条评论
首页
栏目
摄影类
茶余饭后
软件类
页面
友情链接
全景相册
随机剧照
本站声明
壁纸
搜索到
611
篇与
傻木
的结果
2025-03-14
大数据已死
大数据已死 "大数据"这个词,大家想必耳熟能详。这是最大众化的 IT 词汇之一,全社会曾经都热衷于它。  百度指数显示,"大数据"从2011年开始进入搜索引擎,然后快速传播,在2017年~2019年之间达到顶峰。 那时,大家都认为,数据在未来将指数式增长,世界将被海量数据淹没。如何处理这些数据,就成为了关键问题。它决定了一个企业甚至一个国家在信息时代的竞争力。 于是,企业纷纷寻求大数据解决方案,出现了很多相关的招聘岗位,还都是高薪。高校也积极响应,有报道称,国内有600多所高校开设了"大数据专业"或"大数据学院",其中包括北京大学、复旦大学这样的名校。  但是,十年过去了,大数据并没有成为发展的瓶颈,我们依然足以处理产生的所有数据,在可预见的将来也是如此。 预言中的大数据时代,看上去不仅没有来临,反而变得遥遥无期了。 "大数据"这个词的热度,也在不断降温,被提及次数变少了,招聘岗位也慢慢不见了。 与之相应的是,"大数据"这个技术领域,也进展甚微,没有诞生新的概念和理论,技术没有突破,很多方向都停滞不前。 比如,专为处理大数据而设计的 NoSQL 数据库,声势越来越小,陷入停滞,反而是传统的关系型数据库(SQLite、Postgres、MySQL)强劲增长,越发受欢迎。 这是怎么回事?  谷歌的大数据工程师乔丹·蒂加尼 (Jordan Tigani),最近直言不讳地说:"大数据已死"。 他认为,大数据时代已经结束了,大数据的存储和分析,作为一个技术问题已经解决了。 用户已经不必担心数据大小了,再多的数据都不是问题。 他提出了"大数据已死"的6个理由,我觉得很有说服力,下面就跟大家分享。 (1)绝大多数企业到不了大数据级别。 企业的数据量往往不到 1TB,很多甚至不到 100GB。 假设一家中等规模的制造业公司,拥有1000个客户,每个客户每天产生一个订单,每个订单包含100个产品。这家公司一天产生的数据量,依然远远小于 1 MB。三年后,数据总量也只有 1 GB,达到 1 TB 需要几千年。 就算是大型互联网公司,大多数时候也到不了大数据级别。假设某个营销活动有100万用户参加,并且同一时间,该公司开展了几十个这样的营销活动,每天的数据量依然不足 1 GB,就算加上各种日志,可能也只有几个 GB,这跟大数据相差甚远。 (2)存储和计算正在分离。 大数据包含"数据存储"和"数据计算"两个方面,如果放在一个系统里面处理,确实很难。 但是,这两方面现在已经能够脱钩,变成两个独立系统,各自都能独立扩展。这意味着,"数据计算"不受"数据存储"(数据库大小)的限制,反之依然。 因此,大数据作为单一问题就不存在了,变成了海量存储和大型计算两个问题。 (3)没有新业务的情况下,数据是线性增长的, 即每天的新增数据与以前的数据结构相同。 以前的数据一旦写入数据库,通常就不再发生变化,也没有新的计算需求,相关计算在以前就完成了。这时只要对最近的新增数据进行单独计算,然后保存就可以了。你很少需要每天扫描一遍旧数据:那些数据一成不变,为什么要一遍一遍计算它们呢? 因此,对于一家企业来说,"数据会指数式增长"这个假设并不成立。而且,数据计算的需求,其实比数据存储的需求小得多,因为老数据很少需要再次计算。 (4)人们看重的往往只是最近的数据。最频繁的查询是针对24小时内产生的数据,一周前的数据的查询可能性要低20倍,一个月前的历史数据只会偶尔被查询。 这意味着,大数据更像静态数据,而不完全是动态数据。既然以前的数据很少用到,那么就可以压缩保存。一个包含10年数据的表格,可能会达到 PB 级别,但是如果压缩保存历史数据,压缩后可能不到 50 GB。 (5)真正拥有大数据的公司,几乎从不查询全部数据。他们90%的查询涉及的数据少于 100 MB,涉及 TB 级别数据的查询非常少。 就算查询 TB 级别数据,查询性能的优先级往往并不高。等一个周末或几天才拿到结果,通常是可以接受的。 另外,大型数据集的查询非常昂贵。谷歌的 BigQuery 的 PB 级别查询报价是 5,000 美元,即使是大公司也不会经常使用。 (6)硬件的飞速发展,使得单台计算机的计算能力大增。 2004年,谷歌发表 MapReduce 论文时,单机的计算能力还比较弱,很多计算必须通过分布式完成。 2006年,AWS 推出了 EC2 云主机,你只能用到一个单核 CPU 和 2 GB 内存。今天,AWS 的标准实例具有64个内核和 256 GB 内存。如果愿意多花钱,还可以拿到445个内核和超过 24 TB 内存。 单机计算能力大大增强,意味着大数据的最大难点----分布式计算----即使被用到,困难程度也大大降低。 综上所述,结论就是:数据量已经不需要特别关注了,再也不必担心处理不了海量数据了。 大数据作为一个技术问题,已经解决了。 [转载](https://www.ruanyifeng.com/blog/2023/03/weekly-issue-244.html)
2025年03月14日
223 阅读
0 评论
0 点赞
2025-03-08 南山博物馆,南头古城
2025年03月08日
294 阅读
0 评论
0 点赞
2025-03-08
2025-03-08 南山博物馆,南头古城 公司楼下要开个烤串店了                                             
2025-03-06
Spark-TTS,极简版音频克隆
Spark-TTS,极简版音频克隆 干啥的? 如果你是播客,经常在b站发视频解说之类的 可以录制一段你说话的录音 然后输入一段文本,生成音频,用你的音色生成一段音频 你还可以叫猪八戒给你讲故事 等等等等 使用方法非常简单 上传一段参考音频或者录制你自己的声音 输入你想转换成音频的文本 点击开始克隆即可 Spark-TTS是一款先进的文本转语音(Text-to-Speech,TTS)系统, 它利用大型语言模型(Large Language Model,LLM)的强大功能,实现了高度准确且自然流畅的语音合成。 该系统旨在为研究和生产使用提供高效、灵活且强大的解决方案。 Spark-TTS的核心优势在于其简洁性和效率。 它完全基于Qwen2.5构建,无需额外的生成模型,如流匹配模型等。 这一设计使得Spark-TTS能够直接从LLM预测的代码中重构音频,从而简化了流程,提高了效率,并降低了复杂性。 这种创新的方法使得Spark-TTS在语音合成领域具有显著的优势。 此外,Spark-TTS还支持零样本语音克隆(Zero-Shot Voice Cloning), 这意味着它可以复制说话者的声音,而无需为该声音提供特定的训练数据。 这一功能在跨语言和代码切换场景中尤为有用,它允许Spark-TTS在不同的语言和声音之间无缝切换,而无需为每个语言或声音分别进行训练。 Spark-TTS还支持中文和英文,这使得它能够在多种语言环境中提供高质量的语音合成服务。 同时,通过调整参数如性别、音调和语速等,Spark-TTS还可以创建虚拟说话者,为用户提供更加个性化的语音合成体验。 然而,需要注意的是,Spark-TTS主要用于学术研究、教育目的以及合法应用,如个性化语音合成、辅助技术和语言学研究等。 用户在使用时应遵守当地法律法规和道德规范,不得将Spark-TTS用于未经授权的语音克隆、冒充、欺诈、诈骗、深度伪造或任何非法活动。 jian27打包 [https://www.jian27.com/html/1459.html](https://www.jian27.com/html/1459.html) 我在jian27打包基础上进行了二次负优化 将我不需要的web界面进行了删减 删减了原包中用不上的文件,压缩包整体进行了减肥(原作 5.99gb,本站负优化后,4.11gb) 修复了一个致命bug 当文本输入框中有回车换行时,原作只会生成第一句,剩下的都舍弃了 本站所发的版本已经修复该问题,回车也不影响音频生成 另外还加了显存回收 效果的话,大概能达到原音参考音频的7成左右 某些时候转换出来的音频会语速较快 需要黄皮显卡,显存4gb以上即可 推荐6gb以上显卡  回复后,刷新可以看见下载链接 隐藏内容,请前往内页查看详情
2025年03月06日
956 阅读
2 评论
0 点赞
2025_03_02-荔枝公园,蓝忘机
2025年03月03日
204 阅读
0 评论
0 点赞
2025-03-03
2025_03_02-荔枝公园,蓝忘机             
2025_03_02-荔枝公园,树枝
2025年03月03日
227 阅读
0 评论
0 点赞
2025-03-03
2025_03_02-荔枝公园,树枝              
2025-03-01 华侨城创意文化园
2025年03月01日
215 阅读
0 评论
0 点赞
2025-03-01
2025-03-01 华侨城创意文化园 来回逛了两次 所以有些场景是重复的,图片是按照时间线上传的 都非常喜欢 所以这个帖子图片非常多                                                   
2025,02,25,流水账
2025年02月25日
427 阅读
0 评论
0 点赞
2025-02-25
2025,02,25,流水账 今天去工厂了 特么办公室一没有素质手机滴滴滴响个不停 真特么没素质 根本不知道公众场合文明礼仪是何物 不是不能搞他 我是网管 有很多办法搞他 不搞他,一是碍于其他人面子 一是我知道这不道德 无奈,只能去避避 楼顶天台 刚搬过来那会是开放的 在后面一段时间锁起来的 锁了相当一段时间 今天发现门是开着的 原本也应该开着的 毕竟天台是重要的消防通道 法律规定必须开放 就上去看看 结果全都遮起来了 全部安装了太阳能板 有个楼梯,就爬上去看了看 看样子装的时间不长 角度太平,导致雨水加灰尘沉积在凹陷处 这也是没办法 毕竟广东台风多 装得太陡峭的话,台风天容易吹翻    这是好多年前拆解的索尼卡片机  下班回来跟老板去看了会场 环境很不错            
1
...
16
17
18
...
88
网站版权本人所有,你要有本事,盗版不究。 sam@gpcb.net