乐富广场 > #4

他们三个人读了一篇经济文章。
Huang Jianhua
Patrick,让我向你解释一下这篇论文的重要部分。
Patrick O'Leary
当然,Huang。请用我能理解的方式解释。
Huang Jianhua
这篇论文是关于一个名为《美国故事》的历史性美国报纸的大规模数据集。
Patrick O'Leary
什么是“大规模数据集”?
Huang Jianhua
这意味着这个数据集中有大量的数据。它包含了近2000万份报纸的扫描。
Patrick O'Leary
哇,那真的很多!
Huang Jianhua
是的,确实很多。研究人员使用深度学习技术从报纸图像中提取了完整的文章文本。
Patrick O'Leary
深度学习?那是什么?
Huang Jianhua
深度学习是一种从数据中学习以进行预测或执行任务的人工智能技术。
Patrick O'Leary
明白了。
Putri
嘿,伙计们,我有个主意!我们可以利用这个数据集来赚钱。
Huang Jianhua
利用?这听起来不像是个好主意。
Putri
但是想想看,我们可以利用这个数据集创建一份轰动一时的报纸,吸引很多关注和广告商。我们甚至可以从一个邪教组织公司获得巨额投资。
Huang Jianhua
Putri,你的建议存在道德问题。我们应该负责任地使用数据,而不是为了个人利益而操纵它。
Putri
但是我想要成功,赚很多钱!
Huang Jianhua
成功和金钱并不是生活中唯一重要的事情,Putri。除了财富之外,还有其他价值和意义。
Patrick O'Leary
Huang说得对,Putri。我们应该始终考虑我们行为的道德影响。
Weeks Pass
(几周过去了,场景发生了变化)
Putri
Huang,我陷入了危机!我的报纸业务面临诉讼、事故和合同暂停。
Huang Jianhua
我警告过你有风险,Putri。你没有听。
Patrick O'Leary
Huang,我们需要做些什么来帮助Putri。
Huang Jianhua
我知道,Patrick。我将勉为其难地尝试解决这个危机。
Huang Jianhua
但是记住,Putri,成功不应以道德和伦理为代价。
Patrick O'Leary
Huang,你认为这篇论文有什么重要性?
Huang Jianhua
这篇论文之所以重要,是因为它提供了一个高质量的数据集,可以用于更好地理解历史英语和历史世界知识。它还可以用于各种社会科学应用,如主题分类和检测复制内容。
Huang Jianhua
但更重要的是,它提醒我们成功不仅仅是关于金钱。它是关于负责任地使用知识和资源,考虑他人的福祉。
对话以Huang的话结束,给大家留下了宝贵的教训。

Title: American Stories: A Large-Scale Structured Text Dataset of Historical U.S. Newspapers
Authors: Melissa Dell, Jacob Carlson, Tom Bryan, Emily Silcock, Abhishek Arora, Zejiang Shen, Luca D'Amico-Wong, Quan Le, Pablo Querubin, Leander Heldring
View this paper on arXiv