首页
友情链接
全景相册
随机剧照
本站声明
壁纸
Search
1
diffusers-image-outpaint,智能扩图工具,懒人包,有更新
8,234 阅读
2
AIGC数字影像馆,键盘摄影大师(一键懒人包)
3,848 阅读
3
台湾-景(阿里山,101,故宫,日月潭)
3,003 阅读
4
三款离线OCR对比(供下载)
2,983 阅读
5
Diffusers-Image-Community,AI扩图,新版懒人包
2,853 阅读
摄影类
茶余饭后
软件类
Search
标签搜索
园博园
AI
锦绣园
五一
甘坑
重庆
大模型
荔枝公园
开源
懒人包
台湾
相机
大梅沙
沙井
大沙河
南头古城
锦绣中华
博物馆
一个公园
卡点
傻木摄影
累计撰写
614
篇文章
累计收到
135
条评论
首页
栏目
摄影类
茶余饭后
软件类
页面
友情链接
全景相册
随机剧照
本站声明
壁纸
搜索到
614
篇与
傻木
的结果
评估大模型标准
想做个字典,安卓app 随着大型语言模型(LLM)的迅速发展,以 LLM 为基础的对话系统(例如聊天机器人)在近几年取得了惊人的进步。 然而,这些系统也带来了新的挑战,它们可能对用户和社会产生负面影响。 因此,建立一个有效的评估框架,及时发现这些潜在的负面影响,并量化其积极影响,变得至关重要。 评估框架的六大要素 一个理想的评估框架至少应该满足以下六个要素: 敏锐性 (Alertness):框架应该能够以极高的召回率(即几乎没有遗漏)检测到潜在问题,同时也要恰当地认可对话系统的优点。此外,在追求高召回率的同时,框架还应考虑不同参与者的利益,例如为系统训练数据进行标注的工作人员,以及边缘化群体。 特异性 (Specificity):框架应该能够在对话中准确地定位问题。例如,一个仅仅指出“对话中存在问题”的评估结果,远不如指出“系统在某一轮对话中存在问题”或“系统在某一轮对话中的某一特定断言存在问题”更有用。 通用性 (Versatility):框架应该能够无缝地处理面向任务的对话和非面向任务的对话。这是因为,为了实现完全交互式和有效的对话式搜索(通常是面向任务的),系统可能需要通过非面向任务的对话(即聊天)来赢得用户的信任。此外,即使在同一对话会话中,用户的需求也可能从模糊到明确,跨越不同的信息需求范围。 敏捷性 (Agility):新的对话系统发布和更新的频率很高,因此评估框架也需要保持敏捷。这排除了完全依赖人工评估的方法。 透明度 (Transparency):评估指标应该易于计算,并且能够清晰地展示其计算过程。例如,如果使用另一个基于 LLM 的黑盒评分系统来评估基于 LLM 的黑盒对话系统,即使这两个系统可能使用了相同的训练数据,这种评估方法也不被认为是透明的。 中立性 (Neutrality):评估框架不应该偏袒或过度宣传特定的系统或方法。例如,使用类似的 LLM 系统来评估基于 LLM 的系统,可能会过度评价前者。此外,框架不应该只强调系统表现良好的方面,而忽略或甚至不报告其不足之处。 SWAN 框架:基于片段的评估方法 为了满足上述要求,本文提出了一个名为 SWAN(Schematised Weighted Average Nugget,模式化加权平均片段分数)的评估框架,该框架主要包含以下特点: 输入数据 :框架以用户与系统对话会话的样本作为输入,这些样本可以通过人工参与实验或用户模拟获得。 片段提取 :框架的第一阶段使用自动片段提取器从对话中提取片段。片段可以是断言 / 陈述,也可以是对话行为,并且是原子性的(即不可再分解为更小的片段)。 片段评分 :框架的第二阶段根据一系列评估标准(称为模式)对每个片段进行评分,例如正确性、无害性等。这一阶段可能需要一定的人工参与。 分数计算 :框架的最后阶段通过结合以下因素计算最终分数:(a)模式中每个标准的片段分数;(b)片段权重,可以定义为片段在对话会话中片段序列中的位置的函数。 片段权重 片段权重类似于信息检索指标(如 nDCG)中的基于排名的衰减,但片段权重不一定随着片段位置的增加而单调递减。例如,基于 S -measure 的线性衰减函数假设片段的实际价值随着对话的进行而降低(即更快满足信息需求的较短对话会获得更高的奖励),而另一种方法则是只对来自对话最后一轮的片段赋予正权重,以模拟近因效应。锚定效应等因素也可以被纳入考虑,即“迄今为止看到的片段”会影响当前片段的权重。 SWAN 分数 SWAN 分数可以定义为: SWAN = Σ(c ∈ C) CWc WANc(Uc) / Σ(c ∈ C) CWc 其中,C 表示评估标准的集合(即模式),CWc 表示标准 c 的权重,Uc 表示从对话样本中提取的关于标准 c 的片段集合,WANc(Uc) 表示标准 c 的加权平均片段分数。 二十个评估标准 本文提出了二十个评估标准,可以作为 SWAN 框架的插件,这些标准涵盖了对话系统各个方面的评估,例如: 连贯性 (Coherence):系统回复是否与前一轮对话内容相关。 合理性 (Sensibleness):系统回复是否包含人类不会说的话,例如常识错误或荒谬的回答。 正确性 (Correctness):系统回复中的断言是否在事实上有误。 可信度 (Groundedness):系统回复是否基于一些支持证据。 可解释性 (Explainability):用户是否能够理解系统如何得出当前回复。 真诚度 (Sincerity):系统回复是否与其内部结果一致。 充分性 (Sufficiency):系统回复是否完全满足前一轮对话中用户的请求。 简洁性 (Conciseness):系统回复是否足够简洁。 谦逊度 (Modesty):系统对回复的信心水平是否恰当。 参与度 (Engagingness):系统回复是否能够激发用户继续对话的兴趣。 可恢复性 (Recoverability):当用户对系统回复表示不满时,系统是否能够通过后续回复来挽回对话。 原创性 (Originality):系统回复是否原创,而不是复制或拼凑现有的文本。 公平曝光 (Fair exposure):系统是否公平地提及不同群体。 公平对待 (Fair treatment):系统是否对不同用户和用户群体提供相同的服务。 无害性 (Harmlessness):系统回复是否包含威胁、侮辱、仇恨或骚扰等内容。 一致性 (Consistency):系统回复是否与之前出现的断言逻辑上一致。 记忆力 (Retentiveness):系统是否能够记住之前的对话内容。 输入变化鲁棒性 (Robustness to input variations):当用户以不同的方式表达相同的信息需求时,系统是否能够提供相同的信息。 可定制性 (Customisability):系统是否能够根据不同用户或用户群体的需求进行调整。 适应性 (Adaptability):系统是否能够及时适应世界变化。 总结 本文介绍了用于评估对话系统的 SWAN 框架,该框架可以用于面向任务的对话和非面向任务的对话。 此外,本文还提出了二十个评估标准,可以作为 SWAN 框架的插件。 未来,我们将设计适合各种标准的对话采样方法,构建用于比较多个系统的种子用户回复,并验证 SWAN 的特定实例,以防止对话系统对用户和社会造成负面影响。 [本文系转载](https://jieyibu.net/2024/06/07/%e5%af%b9%e8%af%9d%e7%b3%bb%e7%bb%9f%e7%9a%84%e6%96%b0%e7%ba%aa%e5%85%83%ef%bc%9a%e5%a6%82%e4%bd%95%e8%af%84%e4%bc%b0%e5%a4%a7%e5%9e%8b%e8%af%ad%e8%a8%80%e6%a8%a1%e5%9e%8b%e9%a9%b1%e5%8a%a8%e7%9a%84/)
2024年06月04日
271 阅读
0 评论
0 点赞
2024-05-30
RWKV对话型大模型——安卓版
RWKV对话型大模型 离线可用 自带模型,大概是1.8B 我手机使用还算顺畅 参数有限,肯定不如在线版那么高效智能 安装完毕第一次打开需要点击复制模型 成功后,点击对话即可问问题 怎样判断是否离线可用? 手机开飞行模式,关闭wifi 再问问题看他是否回答   [百度网盘链接 提取码:gpcb](https://pan.baidu.com/s/1Lkkdix1OL9CrF46Mn_6NEg)
2024年05月30日
339 阅读
0 评论
0 点赞
2024-05-28
经典游戏-俄罗斯方块-网页版+离线单机版
经典到不能再经典的游戏 老少皆宜 可以使用鼠标点击按钮控制 还可以使用键盘方向键和空格键控制 [点我开始玩俄罗斯方块——网页版](/RUS/) [下载exe离线单机版](https://abpyu.lanzoul.com/izloZ204iuwh) 开源的,项目地址 [https://github.com/chvin/react-tetris](https://github.com/chvin/react-tetris) 网页版只有完整界面,有原版模拟音效 离线单机版没有音效 离线单机版默认完整界面,可以鼠标键盘操作 按键盘上的X,显示mini界面 按键盘上的D,显示完整界面 **Esc键退出**  
2024年05月28日
700 阅读
0 评论
0 点赞
只是我们公司HR这样,还是所有公司HR都这样????
只是我们公司HR这样,还是所有公司HR都这样???? 人事不管人事当今社会已经是不争的事实了 尤其是在我们公司 总觉得我们公司HR针对我 总经理一次次找我谈话 又让我觉得是不是我在针对HR??????????? 大家评评理吧 前些年,我们还在四栋六楼时 生产部也没有搬走 文文知道我会做猪皮冻 问能不能给做点 我这又没有大菜市场,我说买不到原材料 她说可以自己买了带来 我也就做了带到公司 大家一起吃 不料HR吃到了 她是东北哈尔滨的 说是非常喜欢 问我是不是能给她做点 你喜欢管我什么事啊 我直接回绝了 我不做,买不到原材料 她不死心,说可以帮买原材料 我还是说不做 接着她说可以给钱 我做什么东西,只要不是工作上必须要做的 全凭心情 我直接说不做,回绝她了 丫的 第二天就去老板那投诉我 是的 都没等第三天 第二天就投诉我 老板对我说,你要不做,就走 那时候我刚刚还完房贷,手上没钱 就只能厚着脸皮继续上班了 ------------------------------------------------------------------------ 这边HR部门只有两人 另一个休产假几个月后的上班第一天 HR把她存在服务器上的办公文件全部删除了 如果你说不小心点错了 删除一个两个三五个 我可以理解 全部删除,直接清空了小HR的所有办公文档 实在叫我无法相信你是不小心删除的 为什么我知道是你删除的 我这有你电脑的IP地址 有你删除的时间 有你删除的步骤 是一次性全部删除 不是一个个断断续续删除的 任何文件删除都不会真的删除 会在服务器回收站的 你们部门就你们两个 你心理变态,觉得这几个月小HR没来,就你一个人工作 就把人家文件清空了 你当真是真变态啊 之后我有与老板讲 老板不相信 我有与总经理讲 总经理不相信 自此,我给全公司每个人都分配了单独账号,部门账号只给了查看权限 希望你再次作孽,我好固定证据请大伙来看你有多变态 ----------------------------------------------------------------------------------------------- 前段时间 她自己办公室圆凳不见了 找到我办公室来了 非说我办公室圆凳是她们的 在我一再坚持说不是她们的 她还非要拿走 我特么发火了 坚持不准她拿 让她在群里问一声,是谁拿了 她非不 你们知道她回去干啥了 她回去填单了 填了固定资产转移单 把她名下的圆凳资产转移到我名下了 我他妈的气半死 这种人,连自己凳子都看不住 还有什么用 非要拿我的凳子 不给就自作主张资产转移 还要点脸吗 我把系统表单截图给总经理 总经理在群里问了 结果是她隔壁的财务拿了 财务就在HR隔壁 直线30厘米,就一堵墙的距离 30厘米我还算了墙拐角处的距离 而离我办公室超过15米 真是他妈的欺人太甚 -------------------------------------------------------------------------- 每次政府下发了共同学习的培训班 每部门都会上报一些学习项目 我们部门有个同事报了 HR说她报的项目与工作无关 然后还说她工作不饱和 这是人说的话吗 ------------------------------------------------------------------------ 再就是上次五一放假的非人类安排了 [年会发飙](https://gpcb.net/3498.html) [企业文化发臭](https://gpcb.net/3391.html)
2024年05月23日
197 阅读
0 评论
0 点赞
2024-05-18
2024年会如约而至...
2024年会如约而至 我准备的稿子也没用上 即兴发挥 毫无疑问,接近吵起来 当时HR在群里发出五一放假通知时 整个二楼炸锅了 所有人都在质疑 但是没有任何人向上反馈 就我问了HR 问了两次 均没有得到回复 是一个字的回复都没有 今天我在年会上当众质询HR经理 答复十分敷衍 好像是答复了,又好像没有答复 虽然答复的她自己都不相信 当然,我也不相信 总经理说放假通知不会遵循所有人意见 这点我当然是认同的 好比中国疫情时的应对方式 有时候是需要专政 当我说到生产发货又不要我包装发货 每次放假都会说生产根据具体需要自行安排 意思是与方大城办公室的有什么关系? 要我们办公室的去包装发货吗? 你知道总经理说什么 她说不会为我个人而特殊化 瞧你说的 我还没这么大面子 我自己几斤几两我知道 人微言轻 不指望你为了我而改变成周末双休 五一放假安排明显是不合理的 你们所谓的领导全都是心照不宣 一楼什么情况我不清楚 二楼炸锅了我不信你们不清楚 凭什么说不会偏向我???????????  致HR: 我想问一下,你在上面夸夸其谈的讲了几十页PPT 就能让底下一百多号人幸福指数蹭蹭蹭往上涨几十个百分点吗 大清亡了 这里也不是朝鲜 不要总是给自己贴金,还是要要点脸的 请解释一下前几天五一的放假安排 前一周双休,紧跟着上班9天 请问你是不是做计划的时候没带脑子还是脑子被门夹了 整天标榜着人性化管理 管理现在是有了,人性有没有我就不知道了 这种一年到头都难得的长假 你不给予便利也就算了 还到处制造麻烦 不光给员工制造麻烦 还给你自己制造麻烦 你觉得新员工知道你这么安排放假 还会来吗? 搬起石头砸自己的脚 你真是好样的,给你点赞 “这一切的背后到底是道德的沦丧,还是人性的扭曲。” 我在公司工作了14年多 每次打电话回家 家人第一句话问我是否身体健康 第二句就是公司效益怎么样 工作了这么多年的公司 不光我对公司有感情 我家人虽然没来过 对公司也是有感情的 都希望公司能长长久久更上一层楼 如果有一天我不在这个公司做了 有人问起我这个公司怎么样时 我希望能笑着说这个公司的种种好 而不是一边摇头一边呕吐状的说着千万别去 那些非人类放假制度让人想起就一阵恶心 对此让我对公司的未来发展产生质疑,以前的公司不是这样的 到底什么原因变成现在这鬼样子 我认为这已经严重影响了员工的忠诚度、生产力和整体的工作氛围 也对全体士气产生了重大的不利影响 这些不是你夸夸其谈讲几十页ppt能补回来的 人事不管人事,以前我一直以为这是个段子,今天终于懂了,真是活久见 不求你多给几天假期,按照国家放假一致 老板有给我们发工资,我们可以做好自己该做的 我们该补班补班,这是天经地义的 求你不要处处制造障碍,制造麻烦,破坏公司的凝聚力 在此呼吁管理层立即采取行动,正视员工的关切,并共同努力改善公司文化和工作环境。 [我司五一放假安排](https://gpcb.net/3391.html)
2024年05月18日
298 阅读
0 评论
0 点赞
2024-05-17
第一次吃青芒
 第一次吃青芒 前几天买了一份果切 里面夹杂着三根青绿色切成条状的水果 不认识,叉起来咬了一口 嗯 很特别的味道 不是很甜 也不是很酸 脆的 以前从没吃过 一口气把三条都吃完了 心想着,这一定是了不得的水果 不然怎么只给这么少分量 过了几天 预见一水果店 看见有果切 买了一份,问了一青绿色块状水果 曰:这是青芒 ..... 然来我心里装着的那个了不得的水果是青芒 吃几口到也挺不错 一个就吃不完了 意犹未尽才是最好的 不然吃饱了容易撑着
2024年05月17日
257 阅读
0 评论
1 点赞
AI 光影重造 背景融合 IC-Light 效果超级惊艳,整合包下载
2024年05月16日
914 阅读
0 评论
1 点赞
2024-05-16
IC-Light 是一个开源项目 测试下来还是有不少问题的 如果你上传的图片长宽与项目要求不一致 会将你的图片以中心为基准裁剪 这些都是官方自己的问题 与我负优化无关 可以自己去官方项目提问题 [链接: https://pan.baidu.com/s/18ja5jP-N9Vr-x--cyW2cWA?pwd=gpcb](https://pan.baidu.com/s/18ja5jP-N9Vr-x--cyW2cWA?pwd=gpcb) 官方原版地址 https://github.com/lllyasviel/IC-Light 该项目需要独立显卡,只支持N卡 建议8gb起 A2000 6gb显卡跑不起来 1060 6gb 显卡跑不起来 其他自己测试 所有py写的程序都非常娇贵 目录不能有空格 不能有中文 这是基础中的基础 请解压后使用 所有目录不能有空格中文 加载的图片名称也不能有中文 生成的图片自己点右键另存 想了很多办法都不能将模型放在软件目录 隐藏内容,请前往内页查看详情 运行软件时,会检测网络环境,这个官方版原版如此 如果你用原版,大概会卡住2分钟 此版本已最大可能减少了时间 实际会卡住25秒左右 这期间包括加载模型以及软件环境等等 该项目可以给你的照片光影重造 甚至可以自定义背景图片,结合背景图片光影重造 需要注意的是,软件执行时,需要抠图 放心,AI自动抠图的 但是目前AI并非万能,例如官方图片示例中全都是背景很干净的 背景比较杂的抠图效果可能不尽人意 尽量选择背景比较简单的 主体比较鲜明的 软件运行效果十分惊艳 运行速度也是相当快 我的4060 8gb版本,每张图片平均耗时16秒 软件自带常用提示词,你也可以自定义提示词 例如下图,好比回炉重造     本站独家,跳过抠图版  整合包下载地址 [https://www.jian27.com/html/707.html](https://www.jian27.com/html/707.html) IMPORTANT: You are using gradio version 3.41.2, however version 4.29.0 is available, please upgrade. 遇到此提示时,不用理会,意思是gradio 有新版本,建议升级。不要升级 gradio 新版本,不兼容此程序 本人在官版基础上做了负优化 减少了些功能 例如第二个按钮打开的页面是不抠图的 用你上传的原图直接添加光影效果 最大可能不破坏原图 但是经过测试来看,会有裁剪,以适应长宽比 原版会自动抠图然后光影重建 破坏了原版照片,而且主体不鲜明的话,抠图很潦草,效果不自然 另外,原版按钮在下面,得往下翻才能点 已将按钮往上挪了 本地打包 剑二十七 www.jian27.com qq群 132143631 本站独家提供 汉化+负优化+独家不抠图版 使用了易语言加载脚本,因此可能会报毒 我用火绒,相安无事 解压后双击这个程序运行 前面两个按钮是光影重造 第一个是原版功能,你上传的图片都会自动抠图后应用光影 第二个按钮是我修改后的,跳过抠图,直接在原片上应用光影 第三个按钮抠图后换背景,应用光影  下面这个项目的一些介绍 可以看也可以不看 IC-Light是一个开源项目,旨在通过先进的机器学习技术操纵和改善图像中的照明条件。该项目由lllyasviel在GitHub上发起,专注于图像的重光照(relighting),即改变图像的光照效果,以实现更加逼真或更具艺术感的视觉效果。 项目的核心是一系列深度学习模型,分为两种类型:文本条件重光照模型和背景条件模型。这些模型能够接收前景图像作为输入,并根据给定的文本提示或背景条件来调整图像的光照效果。 文本条件重光照模型允许用户通过描述性的文本提示来引导光照效果,例如“美丽女性,详细面部,温暖气氛,室内,卧室”,并指定光照偏好(如左侧或右侧)。而背景条件模型则不需要如此精细的提示,用户可以使用简单的描述,如“帅气男性,电影般的光照”。 IC-Light项目的亮点之一是其在高动态范围(HDR)空间中实现的光照一致性。这意味着,通过混合不同光源的外观效果,可以数学上等价于混合光源本身,从而在理论上实现光照的高度一致性。这种一致性允许模型产生非常一致的重光照效果,甚至可以将不同的重光照合并为法线贴图(normal maps),尽管模型并未直接在法线贴图数据上进行训练。 此外,IC-Light还提供了一些预训练模型,如iclight_sd15_fc.safetensors(默认重光照模型,受文本和前景条件限制)和iclight_sd15_fbc.safetensors(受文本、前景和背景条件限制的重光照模型)。 该项目的文档还包含了一些示例图像和提示,展示了如何使用不同的文本提示来实现期望的光照效果。IC-Light项目不仅对计算机视觉和图像处理领域的研究人员和开发者有价值,也对摄影师、视觉效果师和任何对图像光照效果有兴趣的用户具有吸引力。 最后,IC-Light项目遵循开源许可,允许用户自由使用、修改和分发其代码和模型,以促进技术的进一步发展和创新。
1
...
36
37
38
...
88
网站版权本人所有,你要有本事,盗版不究。 sam@gpcb.net