Garbage In, Garbage Out

PDF 视图

提交程序

分数: 1
时间限制: 2.0s
内存限制: 512M

作者:
题目类型

题目描述

你需要判断一段文本究竟是:

  • 人类写的,还是
  • 由退化后的大语言模型(LLM)生成的

题目保证,给定文本一定属于以下两类之一:

  1. 人类写的文本:它是给定单词表中的若干单词按某种顺序直接拼接而成,中间没有空格
  2. LLM 生成的文本:它是一个仅由小写字母组成的字符串,其中每个字符都是独立、均匀随机az 中选出的。

你的任务是判断给定字符串属于哪一类:

  • 如果是人类写的,输出 yes
  • 如果是 LLM 生成的,输出 no

输入格式

输入为:

  1. 一行字符串 \(s\),表示待判断的文本;
  2. 一行整数 \(n\),表示单词表大小;
  3. 接下来 \(n\) 行,每行一个字符串 \(w\),表示单词表中的一个单词。

保证:

  • 所有字符串都只由小写英文字母 a-z 组成;
  • 单词表中的单词互不相同;
  • 对于正式评测,恰好有 100 个测试点;
  • 每个正式测试点都满足:
    • \(|s| = 3 \times 10^5\)
    • \(n = 5000\)
    • 每个单词长度在 \(6\) 到 \(10\) 之间

此外:

  • 对于“人类写的”测试点,同一个测试点中的字符串 \(s\) 在你不同提交之间保持不变;
  • 对于“LLM 生成的”测试点,你每次提交时看到的 \(s\) 都会重新随机生成。

样例规模比正式测试小,仅用于说明格式。

输出格式

如果字符串是人类写的,输出:

yes

否则输出:

no

样例输入 1

ballooncodingballoonacceptedchallengechallengecoding
5
accepted
balloon
challenge
coding
algorithms

样例输出 1

yes

样例输入 2

nlaiueakuyclocedxlwvxdbiifqjbinucjabzyaqakhohgympi
5
aaaaaaaaaa
bbbbbbbbbb
aababbb
aaabbbaaa
abaaba

样例输出 2

no

样例输入 3

aaaaaaaaaaabbbbbbbbbbaaaaaaaaaaaaaaabbbbbbbbbbbbbb
5
aaaaaaaaa
bbbbbbbbbb
aabbbbb
aaaaabbbb
bbbbba

样例输出 3

yes

评论

目前没有评论。