首页
友情链接
全景相册
随机剧照
本站声明
壁纸
Search
1
diffusers-image-outpaint,智能扩图工具,懒人包,有更新
4,381 阅读
2
九寨沟
2,546 阅读
3
三款离线OCR对比(供下载)
2,531 阅读
4
台湾-景(阿里山,101,故宫,日月潭)
2,512 阅读
5
AIGC数字影像馆,键盘摄影大师(一键懒人包)
2,020 阅读
摄影类
茶余饭后
软件类
登录
Search
标签搜索
园博园
AI
锦绣园
五一
甘坑
重庆
荔枝公园
开源
台湾
相机
大梅沙
沙井
大沙河
南头古城
博物馆
一个公园
懒人包
猫
文和友
扫街
傻木摄影
累计撰写
531
篇文章
累计收到
95
条评论
首页
栏目
摄影类
茶余饭后
软件类
页面
友情链接
全景相册
随机剧照
本站声明
壁纸
搜索到
197
篇与
» 茶余饭后
的结果
2025-03-14
大数据已死
大数据已死 "大数据"这个词,大家想必耳熟能详。这是最大众化的 IT 词汇之一,全社会曾经都热衷于它。  百度指数显示,"大数据"从2011年开始进入搜索引擎,然后快速传播,在2017年~2019年之间达到顶峰。 那时,大家都认为,数据在未来将指数式增长,世界将被海量数据淹没。如何处理这些数据,就成为了关键问题。它决定了一个企业甚至一个国家在信息时代的竞争力。 于是,企业纷纷寻求大数据解决方案,出现了很多相关的招聘岗位,还都是高薪。高校也积极响应,有报道称,国内有600多所高校开设了"大数据专业"或"大数据学院",其中包括北京大学、复旦大学这样的名校。  但是,十年过去了,大数据并没有成为发展的瓶颈,我们依然足以处理产生的所有数据,在可预见的将来也是如此。 预言中的大数据时代,看上去不仅没有来临,反而变得遥遥无期了。 "大数据"这个词的热度,也在不断降温,被提及次数变少了,招聘岗位也慢慢不见了。 与之相应的是,"大数据"这个技术领域,也进展甚微,没有诞生新的概念和理论,技术没有突破,很多方向都停滞不前。 比如,专为处理大数据而设计的 NoSQL 数据库,声势越来越小,陷入停滞,反而是传统的关系型数据库(SQLite、Postgres、MySQL)强劲增长,越发受欢迎。 这是怎么回事?  谷歌的大数据工程师乔丹·蒂加尼 (Jordan Tigani),最近直言不讳地说:"大数据已死"。 他认为,大数据时代已经结束了,大数据的存储和分析,作为一个技术问题已经解决了。 用户已经不必担心数据大小了,再多的数据都不是问题。 他提出了"大数据已死"的6个理由,我觉得很有说服力,下面就跟大家分享。 (1)绝大多数企业到不了大数据级别。 企业的数据量往往不到 1TB,很多甚至不到 100GB。 假设一家中等规模的制造业公司,拥有1000个客户,每个客户每天产生一个订单,每个订单包含100个产品。这家公司一天产生的数据量,依然远远小于 1 MB。三年后,数据总量也只有 1 GB,达到 1 TB 需要几千年。 就算是大型互联网公司,大多数时候也到不了大数据级别。假设某个营销活动有100万用户参加,并且同一时间,该公司开展了几十个这样的营销活动,每天的数据量依然不足 1 GB,就算加上各种日志,可能也只有几个 GB,这跟大数据相差甚远。 (2)存储和计算正在分离。 大数据包含"数据存储"和"数据计算"两个方面,如果放在一个系统里面处理,确实很难。 但是,这两方面现在已经能够脱钩,变成两个独立系统,各自都能独立扩展。这意味着,"数据计算"不受"数据存储"(数据库大小)的限制,反之依然。 因此,大数据作为单一问题就不存在了,变成了海量存储和大型计算两个问题。 (3)没有新业务的情况下,数据是线性增长的, 即每天的新增数据与以前的数据结构相同。 以前的数据一旦写入数据库,通常就不再发生变化,也没有新的计算需求,相关计算在以前就完成了。这时只要对最近的新增数据进行单独计算,然后保存就可以了。你很少需要每天扫描一遍旧数据:那些数据一成不变,为什么要一遍一遍计算它们呢? 因此,对于一家企业来说,"数据会指数式增长"这个假设并不成立。而且,数据计算的需求,其实比数据存储的需求小得多,因为老数据很少需要再次计算。 (4)人们看重的往往只是最近的数据。最频繁的查询是针对24小时内产生的数据,一周前的数据的查询可能性要低20倍,一个月前的历史数据只会偶尔被查询。 这意味着,大数据更像静态数据,而不完全是动态数据。既然以前的数据很少用到,那么就可以压缩保存。一个包含10年数据的表格,可能会达到 PB 级别,但是如果压缩保存历史数据,压缩后可能不到 50 GB。 (5)真正拥有大数据的公司,几乎从不查询全部数据。他们90%的查询涉及的数据少于 100 MB,涉及 TB 级别数据的查询非常少。 就算查询 TB 级别数据,查询性能的优先级往往并不高。等一个周末或几天才拿到结果,通常是可以接受的。 另外,大型数据集的查询非常昂贵。谷歌的 BigQuery 的 PB 级别查询报价是 5,000 美元,即使是大公司也不会经常使用。 (6)硬件的飞速发展,使得单台计算机的计算能力大增。 2004年,谷歌发表 MapReduce 论文时,单机的计算能力还比较弱,很多计算必须通过分布式完成。 2006年,AWS 推出了 EC2 云主机,你只能用到一个单核 CPU 和 2 GB 内存。今天,AWS 的标准实例具有64个内核和 256 GB 内存。如果愿意多花钱,还可以拿到445个内核和超过 24 TB 内存。 单机计算能力大大增强,意味着大数据的最大难点----分布式计算----即使被用到,困难程度也大大降低。 综上所述,结论就是:数据量已经不需要特别关注了,再也不必担心处理不了海量数据了。 大数据作为一个技术问题,已经解决了。 [转载](https://www.ruanyifeng.com/blog/2023/03/weekly-issue-244.html)
2025年03月14日
90 阅读
0 评论
0 点赞
2025-02-22
电影院偷票房
电影院偷票房 很久没看过电影了 不喜欢跟风随大流 什么越火我越是不看 公司楼下就有一家电影院 看的美国队长 为啥总喜欢看外国片子? 还是不是外国片子里面死的都是外国人 砸的都是国会白宫啥的 这片子太牵强 美国总统变成巨人当街打飞机 给6.3分吧 再说下面这两张电影票 以前总听说偷票房 现在算是知道了 收了我45元 但是票上只写30元 这个对账时,就只会对30元 在我质疑后 给我换票了 写的45   都去看热闹片子了 这片子看的人少 大概五个人左右 电影院这些按摩椅坐的真他妈不舒服 凡是好位置全都是这些按摩椅 操蛋 
2025年02月22日
106 阅读
0 评论
0 点赞
2025-02-19
美剧-良医
美剧-良医 这类题材不少 但是绝对算不上多 我本人非常忌惮医院 不管是我自己去医院 还是去医院看人 都是及其不愿意去的 不喜欢医院 心理学上大概是害怕死亡 因为医院总会关联不好的事情 最近又剧荒 下载了良医 一个自闭症成为一名外科医生 非常有天赋 剧集中各种奇葩病症 以及医院的医生的各种爱恨情仇勾心斗角 还有实习医生为了第一次主刀手术时的流程仪式感 让你看见医生日常是一种怎样的 医者父母心 居中很多感人情节 真希望世界上的所有医院都像这个医院一样以人为本 居中充满血腥 很多画面可能很恶心 不适合所有人观看 可能看了会做噩梦 剧集非常精彩     
2025年02月19日
61 阅读
0 评论
0 点赞
2025-02-18
临走还要搞我??????????????
临走还要搞我?????????????? 2025-02-18 11-45-44 以下来自老板的电话 语音AI转文字,摘录的部分内容 老板:他的那个今天工程部还问我说说你来了没有,我说我不知道这个事情呢 他说那边是有个什么呃,编程电脑的一个图片读取有问题是吗 我:没听说怎么没听说啊 老板: 他们他说曾主管说你今天要过来 没听说他们他他就讲到说半个月前就一直在催你 所以有个问题没解决 然后设备商也过来了 设备商过来说是我们网络的问题 然后你这边说网络没问题 搞得他们现在都很为难 我: 没听说那这个事情我还听谁的呢 老板:他们说你知道这个事情 相当于说没有给到他支持 你又说没听说 我是没听说谁告诉我的嗯 让让他找的 反正这个消息呢是曾主管这边说出来的 我下午的时候我进车间再看一下到底是个什么情况 对他们口头跟我讲到的一个情况呢 就是说可能是我们这边编程的那台电脑里面的一些图片 然后机器去读取的时候 是不是说读取的图片不完整 然后厂家过来看了 说意思就是说是一是网络传输过程当中导致的 但我不清楚这个是是网速问题还是网关问题 还是指其他的什么原因 我我并不清楚 本来我想的是说 那这个情况不管怎么样 我们要以车间的这个相当于人家确实是搞不定 需要我们的支持在那个对吧 我要把到现场把情况先了解一下 如果说我也搞不定 那我再跟公司反馈啊 或者我再去找外面的人嘛 我:呃我看了一下他的记录 他是前面是说编程电脑前面嗯 说跟那个叫什么来着 跟那个离线 aoi 和那个在线 aoi 两个机器需要通讯考数据 然后他说呃需要千兆的 这边呢 就之前呢是是千是是千兆的 但是不知道他怎么用着用着又变成了百兆的带宽呢 所以我让他检查一下网线端口和网线从哪里来的 然后他后面就没有回我 老板:其实这个在车间的话 我哪怕我就单独要不搞个双网卡是吧 我我单独拿一个千千兆的线过去到到设备上 我:所有的网线 所有的交换器都是千兆的 老板:除非是他自己接的 这种东西 你只能是你专业的人员到现场来 根据现场的实际情况去分析 去排查 知道吧 我:因为我把这个解决方案 我说你重新压下水晶头 或者是我把接线方式顺序都告诉他了 然后我说如果你搞不定的话 可以看一下那个线从哪里走的 然后他就就没有回音 没有下文 我以为他搞好了 老板:什么时候的事情 我:稍等,一月二十二号 对 然后他1月22号的8:38 我回复的1月22号的9.02分 他撤回了一条消息 然后就没有下文 我以为他搞好了那个 老板:这个这个东西只么么讲 就是说当然我们俩沟通的事情上面 那我只能说你工作上要注意的问题 我并不是说这个都是你的问题啊 嗯啊 比如说那这个事情你要跟进一下嘛 问一下 那你知道其实现在政主管正在办理离职的手续 他不可能把这些事情跟到位的 他能把工作交就好 我不我这个事情我也不知道啊 不是 我我我讲的意思就是讲就是说如果你知道了有这么一个事情 你也给了建议 其实这个不是最佳方案啊 我要我我我们讲就就就事论事啊 最佳方案是自己到现场了解实际的情况是什么样的啊 这个是一手资料嘛 如果说我到不了现场 我我我给了一些建议 那我去最起码我要跟进啊 我要是问一下这个事情 我:之前用的是好的问题 是是是千兆的 我们电脑网卡也是千兆的 他突然他就变成百兆了 所以我觉得他这个可能是水晶头的问题 这多简单是工程部打个水晶头 我觉得是没有问题啊 所以我告诉他了这个事情怎么解决 然后他就没回应 我以为他解决了呀 老板:嗯嗯 这个是个很小的问题是只是说只是说最后要跟跟进一下这个事情 好的执执行立落地的 事事好的的 有了这个思路 我也知道了 我我到车间我再看一下到底怎么回事 如果说他们谁会打水晶头 让他们就马上打一个 我估计工程部现在找个打水晶头的 都有的会会有的的的 有是吧 我:上次他们自己打的水龙头的的会 老板:行吧 这个事我就做做一的事情的 我:还有还有就是说之前这个有考虑过双网卡 并且 usb 网卡我也寄给戴宗群了 你可以问一下 看 usb 网卡 老板:usb 网卡 那你做不到水龙头当然可以啊 我:usb3.0都可以跑三点三百五十兆每秒 这个都可以做到做到三三千多兆 这个没问题的 老板:好 okok 好的 嗯 行吧 好吧 
2025年02月18日
79 阅读
0 评论
0 点赞
2025了,要有点常识
2025了,要有点常识 早上一个同事说电脑不能开机 我去看了 上周新来的同事把显示器调换了 他这台显示器电源线没插 叫另一个同事换过去的 丫的没给电源线插上 我看又条多的线,就拿走了 导致这台显示器没电源线 我就那条线给他了 叫他自己插上 再一会,他说还是开不了机 我问题显示器是不是开机了 他说显示器不亮 我又去看了 你猜怎么的 他丫的 把三角插头插上电源插座 另一头扔在地上 这人至少是大学毕业的 在我司外销团队 至少英语6级 这点常识都没有 欲哭无泪 真是活久见 天下之大 无奇不有 奇葩
2025年02月10日
124 阅读
0 评论
1 点赞
2025-02-06
2分钟规则
2分钟规则 每当你发现很难开始执行某项任务时,可以试试将其缩减成2分钟的版本。 看一本书 → 看一页书 写一篇文章 → 写一句话 跑10公里 → 穿上跑鞋 做100次俯卧撑 → 做1次俯卧撑 多吃蔬菜水果 → 吃一个水果 编写一个程序 → 编写一个函数 → 编写一行代码 这样做的目的是使上手变得超级容易,让你先上手再说。一旦开始做了(这可能是最艰难的一步),你就会开始有动力,可能会继续做下去。 阅读一页 → 阅读10页 → 读完第一章 写一个句子 → 写文章的开头 → 写出正文 穿上跑鞋 → 步行5分钟 → 跑步5分钟 一旦开始,继续做下去就会容易得多。有时,你甚至会发现,自己在不知不觉间已经完成了任务。  [转载](https://www.ruanyifeng.com/blog/2020/11/weekly-issue-132.html)
2025年02月06日
128 阅读
0 评论
0 点赞
2025-01-20
快乐机
快乐机 1974年,一个美国哲学家提出一个假设,如果世界上有"快乐机", 只要插上电源,就能带来源源不断的快乐,并且无法分辨,这种机器快乐与现实世界的快乐有何不同。  哲学家说,我们就可以观察人们的选择。 如果大多数人选择快乐机,而不是现实生活,这就证明人生的目标是体验尽可能多的快乐(享乐主义)。 当时因为不可能造出快乐机,所以无法验证他的假设是否正确。 现在不一样了,有了游戏机、VR 头盔、短视频平台...... 随着社会发展进步 人们已经不用为了一日三餐奔波劳碌 有了更多属于自己的时间 找不到现实生活中的快乐,就只能刷抖音玩游戏了 [转载](https://www.ruanyifeng.com/blog/2025/01/weekly-issue-334.html)
2025年01月20日
172 阅读
0 评论
0 点赞
1
2
3
...
29
网站版权本人所有,你要有本事,盗版不究。 sam@gpcb.net