首页
友情链接
全景相册
随机剧照
本站声明
壁纸
Search
1
diffusers-image-outpaint,智能扩图工具,懒人包,有更新
6,197 阅读
2
AIGC数字影像馆,键盘摄影大师(一键懒人包)
2,843 阅读
3
三款离线OCR对比(供下载)
2,662 阅读
4
九寨沟
2,649 阅读
5
台湾-景(阿里山,101,故宫,日月潭)
2,632 阅读
摄影类
茶余饭后
软件类
登录
Search
标签搜索
园博园
AI
锦绣园
五一
甘坑
重庆
荔枝公园
开源
懒人包
台湾
相机
大梅沙
沙井
大沙河
南头古城
博物馆
一个公园
猫
文和友
扫街
傻木摄影
累计撰写
547
篇文章
累计收到
112
条评论
首页
栏目
摄影类
茶余饭后
软件类
页面
友情链接
全景相册
随机剧照
本站声明
壁纸
搜索到
200
篇与
» 茶余饭后
的结果
2024-08-12
我梦想中的工作是???
说实话。。。 如果不是胆小,我梦想中的工作,其实是,火葬场的烧炉师傅。 平时领导基本不来,客户呢也不会说话。 如果客户说话了,就把火开大点。。。 
2024年08月12日
198 阅读
0 评论
0 点赞
2024-08-06
贝锐蒲公英路由器那些反人类的设计吐槽
贝锐蒲公英路由器那些反人类的设计吐槽 1 想方设法搞钱是第一要务,不交钱什么端口随机,等等各种让你不爽 2 系统及其不稳定,经常掉线 4 IP地址排序,提了两年多了,至今没有解决 5 旧版系统在线设备名称可以中文命名,升级后给关掉了,只能英文命名,负优化做的极好!!!!!!!!!!!!! 6 实时流量信息就是哄你玩的,随便给你几个数字告诉你我有这功能啊 7 同型号,新路由器不能导入旧路由器的备份,导致旧路由器所有设置全部作废 8 MAC地址大写和小写在这个系统算两个东西,换机配置导出不能用,我用了第三方工具,导出了MAC黑名单,全小写。等我一个个输入到路由器黑名单时,发现设置了黑名单还能上网,然后全部重新再设置一次,操蛋真他妈的操蛋!!!!!!!!!! 9 为了让用户用云端,就连MAC地址白名单黑名单功能都必须在云端设置 上周因为旧款频繁掉线已经换到第五个了 买了双wan口的 设置了mac白名单,全都上不了网 你猜结果咋的? 白名单需要在云端设置,路由器本地没有这个功能 我不能上网了,怎么设置? 这系统工程师是有多脑残啊? 脑残片吃多了吗??????????     
2024年08月06日
189 阅读
0 评论
0 点赞
幸福的一天
2024年08月06日
180 阅读
0 评论
0 点赞
2024-08-06
早晨起床,掀开黑心绵作的被子,用致癌牙膏刷完牙,喝杯过了期的碘超标还掺了三聚氰胺的牛奶,吃根柴油炸的洗衣粉油条,外加一个苏丹红咸蛋。 中午在餐馆点一盘用地沟油炒的避孕药喂的黄膳,再加一碟敌敌畏喷过的白菜,盛两碗杯陈化粮煮的毒米饭; 晚上蒸一盘病的瘦肉精养大的死猪肉做的腊肉,沾上点毛发勾兑的毒酱油,夹两片大粪水浸泡的臭豆腐, 还有用福尔马林泡过的凉拌海蜇皮,抓两个添加了漂白粉和吊白块的大馒头,还喝上两杯富含甲醇的白酒。 吃完不久被云大湿喊去吃加了福尔马林的火锅 唉……这日子过的真是那个爽!!! 这就是一个中国人幸福的一天 上述几样看着是不是都觉得不可思议? 样样都是真的...... 
80年代的这一代人,是被国家放弃的
80年代的这一代人,是被国家放弃的 时代在进步、在发展,可无论社会怎么发展似乎都没有忘记薅80后一把。 作为一个80末,我们一起来聊一聊那些被“薅”的岁月! 1.计划生育 这是多少80后的童年噩梦?可以说,90后00后一定没有在大晚上边睡觉边看星星的经历,那日子回想起来,满身疙瘩。佛祖看了都得流泪,此时,我想起一个舍身喂蚊子的故事,当时的我们和他差不多,唯一不同的是:我们穿着衣服,是被迫的。如果说这还不算,那么半边锅煮饭你见过吗?一个草棚里,唯一的炊具就是那个一般的生铁锅。还有被迫住牛棚的小女孩,引产出来还会动的婴儿。现在又来鼓励生育,苍天好轮回! 2.小学收费 这个我最有话语权,因为这也是我的童年阴影。记得小时候是特别喜欢去学校的,但是真正去了才知道没有那么美好。一年级的学费是50多块钱,我依然记得那个下午放学后,我们正在排队放学回家,驼背校长突然让所有没交学费的学生都站到前面来,站成一排,面对队伍跪下!还说再不交学费就不准进校门!其中,里面就有我。留堂,不做作业挨打那是家常便饭,上课不认真听课打手心那是常有的。没想到,等我上5年级国家又开始免费扫盲了,通过扫盲考试还有补贴,真是离了个大谱! 3.大学收费,毕业工作自己找! 80后上小学时,那时大学免费,毕业了还包分配工作。等80后上大学了,小学免费了,但是大学不仅收费,毕业了还得为了一个工作拼得头破血流!我还记得毕业第一年工作,两个大妈问我是不是毕业分配到单位的,我说不是,我自己找的,太尴尬了。 4.婚姻、住房 80后不找对象的时候,姑娘们神情憨厚,80后开始要结婚的时候,姑娘们要车又要房,还要彩礼才不慌。爷爷结婚两只鸡两斗米;爸爸结婚一头猪配上两个袁大头;80后结婚,借钱又贷款。 80后挣不到钱的时候,房子是分配的。80后能挣钱的时候房子已经买不起了,想要回到农村建个房,地方政府阻挡忙!不批基地怎么办?回到城镇埋头干! 好不容易到了30、40岁,发现家里有4个老人,2个孩子还有房贷、车贷! 好不容易做个生意,又碰上互联网大繁荣的追捕围剿! 80后真的成了被拖垮的一代人,最辛苦的一代! 延迟退休又来了,又让80后赶上了。 哎!能不能放过80后? 以上转载 [原文地址](https://www.163.com/dy/article/HTUPST2E055616TT.html) 以下也是转载,地址不详,摘自群消息 去公园晨练,回来后煮了早餐,送完孙子上学,刚好8点。 来到地铁站,人很多,一小伙子要给我让座,我看了看孱弱的他,说:不用不用,咱们都是上班族。 来到公司,那条刺眼的规定总是让我不适:所有拐杖必须整齐停放在公司门口,违者罚款200元。另一条是在茶水间的温馨提示:同事们请把各自的药瓶药罐贴上标致以免别人吃错了。 这个上午,老板又收到了三份辞职信,辞职理由是:与世长辞。 中午没有食欲,因为昨天把假牙弄丢了。接着我发现HR在休闲区贴了温馨提示:请大家饭后保管好自己的假牙,我们的下水道再也堵不起了。 下午部门开会。我发现主管的记忆退了许多。说完第8点后,突然一句:好,以上是第1点,现在来说第2点。直到下班,我们还是在说第2点。 主管怪责我为什么没有提醒他,其实我一共提醒了他13次。不跟他计较,明年他65岁,就退休了。 我继续“埋头”苦干。这时,我想起63岁的老王,给他发短信:三天没来晨运了,这次又是什么病?老王回复:跑业务,扭到腰了。 今天你60大寿,过得怎样?我说:挺好的,晚上公司没什么人,网速也够快,我还偷偷连续发了好多条微博谈60岁人生感悟,加班就是好! 夜晚11点回到家,菜凉了,孩子们都睡觉了。我躺在冰凉的床上,打开工资条,看着扣除养老保险那一栏,转脸朝着老伴躺的那一边,对着空气说:你等不到的,我尽量替你等到。 若干年后,可能会出现一个奇观,年轻人无法就业,每天逛公园,老年人没法退休,每天上班。于是每天早晨的时候,老太婆就喊了:"孙子,你上午去公园遛鸟之前,先扶你爷爷去单位上班!"
2024年07月22日
56 阅读
0 评论
0 点赞
2024-07-15
想去深山做猴子
突然收到要填一张表 开头一堆废话 然后又是一堆废话 首先,我是谁,什么部门,部门领导 你是发起人,你不清楚吗 这是重复的工作重复做 然后,我过去一个月的工作亮点和成就 如果只是轮到我头上,那我放弃 如果是评选的 那你应该知道我被评选的原因 我不是自荐的,这辈子都不可能自荐 因此这一条不成立 接着第二条,同上 这 大概是应试教育的后遗症吧 什么时候才能不这么官僚 不这么客套 不这么教条 想去深山做猴子  最终,我没有理会这表单 上司早上发我一份她帮我填好的 昨晚我就猜的是她帮我申请的 其实这事不用猜就知道  我很是庆幸 我进了一个好公司 遇到了好的上司 好的老板 虽然边上总有些老鼠屎 世界上还有什么公司没老鼠屎的呢?
2024年07月15日
186 阅读
0 评论
1 点赞
陈萍萍似笑非笑地望着皇帝,忽然开口说道:“她待我好,是像朋友一样待我,陛下待我好,是像奴才一样待我,这能一样吗?”
陈萍萍似笑非笑地望着皇帝,忽然开口说道:“她待我好,是像朋友一样待我,陛下待我好,是像奴才一样待我,这能一样吗?”
2024年07月03日
161 阅读
0 评论
0 点赞
评估大模型标准
想做个字典,安卓app 随着大型语言模型(LLM)的迅速发展,以 LLM 为基础的对话系统(例如聊天机器人)在近几年取得了惊人的进步。 然而,这些系统也带来了新的挑战,它们可能对用户和社会产生负面影响。 因此,建立一个有效的评估框架,及时发现这些潜在的负面影响,并量化其积极影响,变得至关重要。 评估框架的六大要素 一个理想的评估框架至少应该满足以下六个要素: 敏锐性 (Alertness):框架应该能够以极高的召回率(即几乎没有遗漏)检测到潜在问题,同时也要恰当地认可对话系统的优点。此外,在追求高召回率的同时,框架还应考虑不同参与者的利益,例如为系统训练数据进行标注的工作人员,以及边缘化群体。 特异性 (Specificity):框架应该能够在对话中准确地定位问题。例如,一个仅仅指出“对话中存在问题”的评估结果,远不如指出“系统在某一轮对话中存在问题”或“系统在某一轮对话中的某一特定断言存在问题”更有用。 通用性 (Versatility):框架应该能够无缝地处理面向任务的对话和非面向任务的对话。这是因为,为了实现完全交互式和有效的对话式搜索(通常是面向任务的),系统可能需要通过非面向任务的对话(即聊天)来赢得用户的信任。此外,即使在同一对话会话中,用户的需求也可能从模糊到明确,跨越不同的信息需求范围。 敏捷性 (Agility):新的对话系统发布和更新的频率很高,因此评估框架也需要保持敏捷。这排除了完全依赖人工评估的方法。 透明度 (Transparency):评估指标应该易于计算,并且能够清晰地展示其计算过程。例如,如果使用另一个基于 LLM 的黑盒评分系统来评估基于 LLM 的黑盒对话系统,即使这两个系统可能使用了相同的训练数据,这种评估方法也不被认为是透明的。 中立性 (Neutrality):评估框架不应该偏袒或过度宣传特定的系统或方法。例如,使用类似的 LLM 系统来评估基于 LLM 的系统,可能会过度评价前者。此外,框架不应该只强调系统表现良好的方面,而忽略或甚至不报告其不足之处。 SWAN 框架:基于片段的评估方法 为了满足上述要求,本文提出了一个名为 SWAN(Schematised Weighted Average Nugget,模式化加权平均片段分数)的评估框架,该框架主要包含以下特点: 输入数据 :框架以用户与系统对话会话的样本作为输入,这些样本可以通过人工参与实验或用户模拟获得。 片段提取 :框架的第一阶段使用自动片段提取器从对话中提取片段。片段可以是断言 / 陈述,也可以是对话行为,并且是原子性的(即不可再分解为更小的片段)。 片段评分 :框架的第二阶段根据一系列评估标准(称为模式)对每个片段进行评分,例如正确性、无害性等。这一阶段可能需要一定的人工参与。 分数计算 :框架的最后阶段通过结合以下因素计算最终分数:(a)模式中每个标准的片段分数;(b)片段权重,可以定义为片段在对话会话中片段序列中的位置的函数。 片段权重 片段权重类似于信息检索指标(如 nDCG)中的基于排名的衰减,但片段权重不一定随着片段位置的增加而单调递减。例如,基于 S -measure 的线性衰减函数假设片段的实际价值随着对话的进行而降低(即更快满足信息需求的较短对话会获得更高的奖励),而另一种方法则是只对来自对话最后一轮的片段赋予正权重,以模拟近因效应。锚定效应等因素也可以被纳入考虑,即“迄今为止看到的片段”会影响当前片段的权重。 SWAN 分数 SWAN 分数可以定义为: SWAN = Σ(c ∈ C) CWc WANc(Uc) / Σ(c ∈ C) CWc 其中,C 表示评估标准的集合(即模式),CWc 表示标准 c 的权重,Uc 表示从对话样本中提取的关于标准 c 的片段集合,WANc(Uc) 表示标准 c 的加权平均片段分数。 二十个评估标准 本文提出了二十个评估标准,可以作为 SWAN 框架的插件,这些标准涵盖了对话系统各个方面的评估,例如: 连贯性 (Coherence):系统回复是否与前一轮对话内容相关。 合理性 (Sensibleness):系统回复是否包含人类不会说的话,例如常识错误或荒谬的回答。 正确性 (Correctness):系统回复中的断言是否在事实上有误。 可信度 (Groundedness):系统回复是否基于一些支持证据。 可解释性 (Explainability):用户是否能够理解系统如何得出当前回复。 真诚度 (Sincerity):系统回复是否与其内部结果一致。 充分性 (Sufficiency):系统回复是否完全满足前一轮对话中用户的请求。 简洁性 (Conciseness):系统回复是否足够简洁。 谦逊度 (Modesty):系统对回复的信心水平是否恰当。 参与度 (Engagingness):系统回复是否能够激发用户继续对话的兴趣。 可恢复性 (Recoverability):当用户对系统回复表示不满时,系统是否能够通过后续回复来挽回对话。 原创性 (Originality):系统回复是否原创,而不是复制或拼凑现有的文本。 公平曝光 (Fair exposure):系统是否公平地提及不同群体。 公平对待 (Fair treatment):系统是否对不同用户和用户群体提供相同的服务。 无害性 (Harmlessness):系统回复是否包含威胁、侮辱、仇恨或骚扰等内容。 一致性 (Consistency):系统回复是否与之前出现的断言逻辑上一致。 记忆力 (Retentiveness):系统是否能够记住之前的对话内容。 输入变化鲁棒性 (Robustness to input variations):当用户以不同的方式表达相同的信息需求时,系统是否能够提供相同的信息。 可定制性 (Customisability):系统是否能够根据不同用户或用户群体的需求进行调整。 适应性 (Adaptability):系统是否能够及时适应世界变化。 总结 本文介绍了用于评估对话系统的 SWAN 框架,该框架可以用于面向任务的对话和非面向任务的对话。 此外,本文还提出了二十个评估标准,可以作为 SWAN 框架的插件。 未来,我们将设计适合各种标准的对话采样方法,构建用于比较多个系统的种子用户回复,并验证 SWAN 的特定实例,以防止对话系统对用户和社会造成负面影响。 [本文系转载](https://jieyibu.net/2024/06/07/%e5%af%b9%e8%af%9d%e7%b3%bb%e7%bb%9f%e7%9a%84%e6%96%b0%e7%ba%aa%e5%85%83%ef%bc%9a%e5%a6%82%e4%bd%95%e8%af%84%e4%bc%b0%e5%a4%a7%e5%9e%8b%e8%af%ad%e8%a8%80%e6%a8%a1%e5%9e%8b%e9%a9%b1%e5%8a%a8%e7%9a%84/)
2024年06月04日
209 阅读
0 评论
0 点赞
1
...
8
9
10
...
29
网站版权本人所有,你要有本事,盗版不究。 sam@gpcb.net