前几天,我谈过在知识提取相关的任务中,我看到的一些因调整LLM的温度所带来的不一致性。


我决定再看看这个话题,并谈谈我观察到的行为。不仅Gemini-1.5-Flash-002没有让我失望,给出了更多意想不到的结果,我还找到了一些强有力的证据,表明长窗口仍然会忽略数据。以下是我在视频中使用的笔记。
点击查看更多内容
为 TA 点赞
评论
共同学习,写下你的评论
评论加载中...
作者其他优质文章
正在加载中
感谢您的支持,我会继续努力的~
扫码打赏,你说多少就多少
赞赏金额会直接到老师账户
支付方式
打开微信扫一扫,即可进行扫码打赏哦