Nestler–Průcha–Pluskal方法

2023 年 08 月 25 日

153 次浏览

2005字数

1 分析程序

1、从每篇教科书文本中，从章节的解释部分中选择至少 200 字或以上的文本（图例、表格中的数据、实验描述等不计算在内）。示例文本以达到 200 个字符数的最后一个句子的末尾结束。（事实证明，200 个单词的数量足以进行分析（Průcha，2002）；
2、计算单词（N）、句子（从大写字母到句号或其他符号）（S）和主动形式动词（V）的总数；
3、确定选定文本中的所有名词和实义动词；
4、把名词分类为：

T1 新的通用术语
T2 新的科学术语（化学细节 - 元素符号、公式等也被视为科学术语）
T3 地理术语（地球，月亮，太阳，地点，州，城市等）
T4 定量术语（数字、时代、百分比、质量等）
T5 重复术语（在选定的文本区域内）

5、步骤 II-IV 中的程序由两名独立研究人员执行。2-4 中的程序是验证性的，而 5 中的程序产生了大量差异。许多名词（术语）要么未被一位或另一位研究人员识别，要么被分类不同。因此，第三位研究人员分析了特定文本以便做出决定（参见Teo等人，2014）；
6、这些数字已添加到每个参数的表中。此外，还计算了两个难度级别：句法难度（N、V和S的公式）和概念难度（T 1 – T 5的公式）。后者的总和给出了文本难度的总体比率。

分析值
总文本难度 D = 句法 Dst + 语义 Dsm
句法 Dst = 0.1·(单词总数N^2）/(动词总和 V · 句子数量 S )
语义 Dsm = 100·(术语总数T / 单词总数N)·(T1 + 3T2 + 2T3 + 2T4 + T5)/单词总数N
文本难度（可读性）还受到平均句子长度（L）和句子部分的平均长度的影响。这两个因素均以单词和句子(4)或主动形式动词(5)总数的分数形式给出。以下所有公式（4-13）均表示出版商书籍中的术语总数。因此，它们是针对特定分析主题计算的项的总和。

2023-08-25T03:45:06.png
2023-08-25T03:36:38.png
除了代表文本可读性的文本难度之外，还需要考虑内容方面。除其他文本外，教科书文本对所用术语均需满足一定的要求。为此，测量项( P )的比例(6)。
2023-08-25T03:37:48.png
这分为特定术语在分析单词总数中的比例(7-11)。
![4]
2023-08-25T03:38:43.png
2023-08-25T03:38:55.png
2023-08-25T03:39:05.png
2023-08-25T03:39:12.png
系数P 1代表新增一般术语的比例，P 2代表新增科学术语的比例，P 3代表地理术语的比例，P 4代表数量术语的比例，P 5代表重复术语的比例。
在五类术语中，T 2、T 3和T 4的总和代表所分析文本传递的科学信息。因此，文本科学价值的另一个方面是科学信息密度（i和h）系数，这也是计算出来的(12) 和 (13)。
2023-08-25T03:39:33.png
2023-08-25T03:39:40.png
i系数给出了以字数表示的科学信息的密度，即描述了文本中科学术语的总体份额。h系数给出了科学信息在术语数量上的密度，即描述了新的领域相关术语的份额。

Nestler–Průcha–Pluskal方法