作者ck960785 (Metal 0-4)
看板Gossiping
标题[问卦] gpt根本不能解100%leetcode hard问题吧
时间Wed Jul 24 20:07:55 2024
小弟刚才使用gpt4o跟claude 3.5 sonnet解UVa的protecting Zong 对应leetcode大概是med
ium -Hard的等级。
我给gpt他们至少各5次测资跟编译错误资讯,结果还是没通过,我靠网路上的解答才通过,
gpt4o/claude 3.5 sonnet 根本过誉了吧
有无gpt被过度神话的八卦?
https://reurl.cc/XGOKm0
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 104.194.11.26 (美国)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Gossiping/M.1721822877.A.B98.html
1F:推 cuteSquirrel: 语言模型 前面讨论过很多次了 114.37.215.9 07/24 20:08
2F:→ cuteSquirrel: gpt本质上是在猜字串 做文字接龙 114.37.215.9 07/24 20:08
3F:推 tkc7: copilot如何呢 36.228.2.80 07/24 20:08
4F:推 coolrobin: 人家就写了人家叫CHATgpt .... 1.163.147.126 07/24 20:09
5F:推 iPhoneX: 他根本不知道他自己在写什麽 122.116.86.152 07/24 20:10
6F:→ iPhoneX: 生成出来的程式码检查一下很高机率有错误 122.116.86.152 07/24 20:10
7F:推 QEMU: 能解hard我看99%软体工程师都要失业了吧 49.159.24.75 07/24 20:11
8F:→ wonder007: 你对大语言模型的误解很深 42.73.101.247 07/24 20:11
9F:推 brucetu: 每次都讲文字接龙有没有想过逻辑思考本223.136.127.131 07/24 20:12
10F:→ brucetu: 来就是文字接龙-.-223.136.127.131 07/24 20:12
11F:→ jackyT: 帮我请他解一下p等不等於np 谢谢喔 220.135.96.100 07/24 20:17
12F:推 wonder007: 他的接龙逻辑更接近直觉而不是深思 42.73.101.247 07/24 20:20
13F:→ wonder007: 直觉是靠大量训练资料得来的 42.73.101.247 07/24 20:21
14F:推 abc0922001: 我测试 hard 通过率大概 80% 118.232.68.52 07/24 20:26
15F:推 swilly0906: hard解的出来 但不是每一题 还有你的 61.231.242.207 07/24 22:07
16F:→ swilly0906: prompt怎麽下是重点 我之前以为不行 61.231.242.207 07/24 22:07
17F:→ swilly0906: 後来别人教我一些prompt技术後 成功 61.231.242.207 07/24 22:07
18F:→ swilly0906: 率提升很多欸 61.231.242.207 07/24 22:08