五二小说网

手机浏览器扫描二维码访问

三数据的搜集和关键指标的度量(第1页)

三、数据的搜集和关键指标的度量

banner"

>

在具体检验他们的假说之前,学者们还需要对假说中的关键“变量”

进行合理的度量。

陈冬华等的具体假说(hypothesis)是:诗歌造诣能否反映个人的道德情操。

这个命题中有两个关键的指标,一个是个人的诗歌造诣,而另一个则是个人的道德情操水平。

为了能够从史书中获得相关的数据,研究者们将目光放在了唐朝。

作者们选择用唐朝史书的数据进行检验,主要是出于数据可得性和变量度量的考虑。

“诗歌创作在唐代达到了鼎盛,在史料中保留了丰富的关于诗人行为、道德以及诗歌创作的记录”

“之所以择唐而弃宋,原因有三个。

一是因为唐代更加注重诗作,诗人灿若辰星,而宋代显然更加重视词作,当然,词也是诗的一种形式,但是词的意境也是自苏轼之后才渐至开阔,并且词始终没有作为科举考试的内容。

二是宋代经靖康之耻,分为南北两宋,使得研究的环境因素变得更加复杂。

三是因为宋代在王安石主政时,在科举中取消了诗赋考试。”

[11]

在数据搜集和度量的过程中,作者们首先解决了如何度量诗歌造诣的问题。

个体在诗歌造诣方面的度量可能有很多种办法。

陈冬华等首先选取了一个具体的比较客观的方法。

作者们将入选《唐诗三百首》作为诗歌造诣的最高层次。

这意味着,在他们的样本中如果一个人的诗歌入选了《唐诗三百首》,他的造诣就被定义为1,否则就定义为0。

“《唐诗三百首》由蘅塘退士孙洙选编于清乾隆二十八年(1763年),是近250年来流传最广、影响很大的一部唐诗选本。

诗选收录诗人77名、唐诗313首,诗选中所收录的诗被认为在文学上具有极高的艺术价值。”

[12]

从这样的度量方法中可以看出,即使是“量化”

的方法,也存在很多不可避免的主观因素。

诗歌造诣是一个很难准确度量的因素,有些很出彩的诗歌并不一定会被《唐诗三百首》引用,而被《唐诗三百首》引用的也未必就一定比没有引用的要好。

正如其他“数字人文”

的研究中遇到的问题一样,在运用量化方法的时候,研究者没有办法百分百客观地剔除掉所有主观的因素。

而研究者可以最大限度剔除掉的就是通常所谓的“系统性”

误差。

具体来说,在陈冬华等的研究中,他们用《唐诗三百首》的是否收录来度量诗人的诗歌造诣,是基于下面这么一个基本的原理:从统计意义上来说,被收录进《唐诗三百首》中的诗歌相比于其他的诗歌更受欢迎。

在这里,我们强调的关键词是“统计意义上”

热门小说推荐
大明嫡子

大明嫡子

洪武二十四年,大明朝嫡子嫡孙朱允熥落水身亡,穿越复活。朱允炆庶子也敢图谋大明皇位。蓝玉大将军是朕最信任的舅爷。锦衣卫权柄过重?那就接着扩编!皇城门前,百官叩阙陛下,燕王乃反贼也!朱允熥嗤之以鼻反贼?不!燕王乃是朕的征北大将军!江山,美人,朕全都要!朱允炆滚一边去!...

遮天之逆袭

遮天之逆袭

遮天之逆袭是楚南狂士精心创作的玄幻,旧时光文学实时更新遮天之逆袭最新章节并且提供无弹窗阅读,书友所发表的遮天之逆袭评论,并不代表旧时光文学赞同或者支持遮天之逆袭读者的观点。...

穿越汉末:我刘璋收拾旧山河

穿越汉末:我刘璋收拾旧山河

关于穿越汉末我刘璋收拾旧山河考古历史系硕士刘璋和考古团队在荆州市公安县的一处古墓考古时,竟意外发现与刘璋同名同姓的汉末三国益州牧刘璋的墓。刘璋稀里糊涂的意外穿越到了汉末时代刘璋的身上,代替了刘璋的灵魂。已经认清现实的刘璋,想要改变历史上刘璋的命运,萌发了征战天下的雄心,成功激活了穿越金手指。自此刘璋开启开挂人生,收集汉末美人,获得奖励,抽取后世英杰,征战三国,一统天下。...

游戏才不会变成现实

游戏才不会变成现实

我的下一本正直的五条银子老师,求收藏啦!盯着游戏面板上第N次出现的be,源千伊觉得很离谱,好好的一个恋爱游戏就不能多出几个好看的CG和好结局吗?给她的人设也都是奇奇怪怪的什么让天与暴君带球跑之后早死的...

每日热搜小说推荐