1 分析程序

1、从每篇教科书文本中,从章节的解释部分中选择至少 200 字或以上的文本(图例、表格中的数据、实验描述等不计算在内)。示例文本以达到 200 个字符数的最后一个句子的末尾结束。(事实证明,200 个单词的数量足以进行分析(Průcha,2002);
2、计算单词(N)、句子(从大写字母到句号或其他符号)(S)和主动形式动词(V)的总数;
3、确定选定文本中的所有名词和实义动词;
4、把名词分类为:

  • T1 新的通用术语
  • T2 新的科学术语(化学细节 - 元素符号、公式等也被视为科学术语)
  • T3 地理术语(地球,月亮,太阳,地点,州,城市等)
  • T4 定量术语(数字、时代、百分比、质量等)
  • T5 重复术语(在选定的文本区域内)

5、步骤 II-IV 中的程序由两名独立研究人员执行。2-4 中的程序是验证性的,而 5 中的程序产生了大量差异。许多名词(术语)要么未被一位或另一位研究人员识别,要么被分类不同。因此,第三位研究人员分析了特定文本以便做出决定(参见Teo等人,2014);
6、这些数字已添加到每个参数的表中。此外,还计算了两个难度级别:句法难度(N、V和S的公式)和概念难度(T 1 – T 5的公式)。后者的总和给出了文本难度的总体比率。

分析值
总文本难度 D = 句法 Dst + 语义 Dsm
句法 Dst = 0.1·(单词总数N^2)/(动词总和 V · 句子数量 S )
语义 Dsm = 100·(术语总数T / 单词总数N)·(T1 + 3T2 + 2T3 + 2T4 + T5)/单词总数N
文本难度(可读性)还受到平均句子长度(L)和句子部分的平均长度的影响。这两个因素均以单词和句子(4)或主动形式动词(5)总数的分数形式给出。以下所有公式(4-13)均表示出版商书籍中的术语总数。因此,它们是针对特定分析主题计算的项的总和。

2023-08-25T03:45:06.png
2023-08-25T03:36:38.png
除了代表文本可读性的文本难度之外,还需要考虑内容方面。除其他文本外,教科书文本对所用术语均需满足一定的要求。为此,测量项( P )的比例(6)。
2023-08-25T03:37:48.png
这分为特定术语在分析单词总数中的比例(7-11)。
![4]
2023-08-25T03:38:43.png
2023-08-25T03:38:55.png
2023-08-25T03:39:05.png
2023-08-25T03:39:12.png
系数P 1代表新增一般术语的比例,P 2代表新增科学术语的比例,P 3代表地理术语的比例,P 4代表数量术语的比例,P 5代表重复术语的比例。
在五类术语中,T 2、T 3和T 4的总和代表所分析文本传递的科学信息。因此,文本科学价值的另一个方面是科学信息密度(i和h)系数,这也是计算出来的(12) 和 (13)。
2023-08-25T03:39:33.png
2023-08-25T03:39:40.png
i系数给出了以字数表示的科学信息的密度,即描述了文本中科学术语的总体份额。h系数给出了科学信息在术语数量上的密度,即描述了新的领域相关术语的份额。

最后修改:2023 年 08 月 25 日
如果觉得我的文章对你有用,请随意赞赏