Garbage In, Garbage Out
PDF 视图题目描述
你需要判断一段文本究竟是:
- 人类写的,还是
- 由退化后的大语言模型(LLM)生成的。
题目保证,给定文本一定属于以下两类之一:
- 人类写的文本:它是给定单词表中的若干单词按某种顺序直接拼接而成,中间没有空格。
- LLM 生成的文本:它是一个仅由小写字母组成的字符串,其中每个字符都是独立、均匀随机从
a到z中选出的。
你的任务是判断给定字符串属于哪一类:
- 如果是人类写的,输出
yes - 如果是 LLM 生成的,输出
no
输入格式
输入为:
- 一行字符串 \(s\),表示待判断的文本;
- 一行整数 \(n\),表示单词表大小;
- 接下来 \(n\) 行,每行一个字符串 \(w\),表示单词表中的一个单词。
保证:
- 所有字符串都只由小写英文字母
a-z组成; - 单词表中的单词互不相同;
- 对于正式评测,恰好有 100 个测试点;
- 每个正式测试点都满足:
- \(|s| = 3 \times 10^5\)
- \(n = 5000\)
- 每个单词长度在 \(6\) 到 \(10\) 之间
此外:
- 对于“人类写的”测试点,同一个测试点中的字符串 \(s\) 在你不同提交之间保持不变;
- 对于“LLM 生成的”测试点,你每次提交时看到的 \(s\) 都会重新随机生成。
样例规模比正式测试小,仅用于说明格式。
输出格式
如果字符串是人类写的,输出:
yes
否则输出:
no
样例输入 1
ballooncodingballoonacceptedchallengechallengecoding
5
accepted
balloon
challenge
coding
algorithms
样例输出 1
yes
样例输入 2
nlaiueakuyclocedxlwvxdbiifqjbinucjabzyaqakhohgympi
5
aaaaaaaaaa
bbbbbbbbbb
aababbb
aaabbbaaa
abaaba
样例输出 2
no
样例输入 3
aaaaaaaaaaabbbbbbbbbbaaaaaaaaaaaaaaabbbbbbbbbbbbbb
5
aaaaaaaaa
bbbbbbbbbb
aabbbbb
aaaaabbbb
bbbbba
样例输出 3
yes
评论