【英語論文の書き方】第92回 「誤解を招く指標を避けるために、何を、なぜ測っているのかを理解する」について
2025年12月22日 17時27分
第91回では「*誤った*精度:パート2:統計的確率」を取り上げました。
第92回(今回)のテーマは
「誤解を招く指標を避けるために、何を、なぜ測っているのかを理解する」
についてです。
科学的思考の美点の一つは、主観的な評価を、
より客観的で比較しやすい定量的な測定値で置き換えようとする点にあります。
このアプローチは、医学のような人間中心の分野から
化学のような、より機械論的な分野まで、
多くの領域で大きな進歩をもたらしてきました。
その一方で、このアプローチは、
重要な事柄を見落とさせてしまうこともあります。
最も重要なことの一つは、
「測定可能である(あるいは数値化できる)というだけで、
その数値に意味がある」と考えてしまう、誤った信念です。
Geoffさんは、その例として、
広く用いられている医学指数であるボディマス指数(BMI)や、
医療で用いられる疼痛スケールを取り上げ、
本来の目的や文脈から外れて使われた結果、
「garbage metric(意味をなさない指標)」になってしまう
危険性を指摘しています。
また、サイエンスエディターとして仕事をするなかで、
著者が定義した尺度の方向性が変数名の意味と逆行している事例や、
そのために自身のデータを誤って解釈してしまう事例を
頻繁に目にすると言及しています。
数値の意味は常に文脈に依存しており、
指標を作る際にその文脈を忘れてしまうのは賢明ではない、
というのがGeoffさんの意見です。
論文を書く際は、著者自身と読者にとっての
数値の意味を十分に理解したうえで、
自分が何を伝えようとしているのかを
慎重に検討することが大切だとも述べています。
本記事が、数値や指標との向き合い方を考える
きっかけとなれば幸いです。
第92回(今回)のテーマは
「誤解を招く指標を避けるために、何を、なぜ測っているのかを理解する」
についてです。
科学的思考の美点の一つは、主観的な評価を、
より客観的で比較しやすい定量的な測定値で置き換えようとする点にあります。
このアプローチは、医学のような人間中心の分野から
化学のような、より機械論的な分野まで、
多くの領域で大きな進歩をもたらしてきました。
その一方で、このアプローチは、
重要な事柄を見落とさせてしまうこともあります。
最も重要なことの一つは、
「測定可能である(あるいは数値化できる)というだけで、
その数値に意味がある」と考えてしまう、誤った信念です。
Geoffさんは、その例として、
広く用いられている医学指数であるボディマス指数(BMI)や、
医療で用いられる疼痛スケールを取り上げ、
本来の目的や文脈から外れて使われた結果、
「garbage metric(意味をなさない指標)」になってしまう
危険性を指摘しています。
また、サイエンスエディターとして仕事をするなかで、
著者が定義した尺度の方向性が変数名の意味と逆行している事例や、
そのために自身のデータを誤って解釈してしまう事例を
頻繁に目にすると言及しています。
数値の意味は常に文脈に依存しており、
指標を作る際にその文脈を忘れてしまうのは賢明ではない、
というのがGeoffさんの意見です。
論文を書く際は、著者自身と読者にとっての
数値の意味を十分に理解したうえで、
自分が何を伝えようとしているのかを
慎重に検討することが大切だとも述べています。
本記事が、数値や指標との向き合い方を考える
きっかけとなれば幸いです。
To avoid misleading metrics, understand what you’re measuring and why
By Geoffrey Hart
One virtue of scientific thinking is that it tries to replace subjective assessments with quantifiable measurements that are more objective and easier to compare. This approach has greatly advanced many areas of endeavor, including both human-centered fields such as medicine and more mechanistic fields such as chemistry. This approach has been tremendously beneficial, but can blind us to important things. One of the most important is the incorrect belief that just because you can measure something (or assign a number to it), the number is meaningful.
Note: Measurements, or indexes (also called indicators) based on measurements, are called metrics, from the Greek word metreo (“to measure or compare”).
Consider the example of a widely used medical index, the body mass index (BMI). This index was designed to determine whether a population of individuals has a generally healthy body weight or is (on average) obese, so that its members need to lose weight. The index is calculated as follows:
BMI = weight (kg) / height (m) squared
You can calculate your own BMI using the online calculator provided by the U.S. National Institutes of Health: (https://www.nhlbi.nih.gov/health/educational/lose_wt/BMI/bmicalc.htm). But why would you? BMI was not designed to describe an individual’s status; rather, it is a population-level measure and is therefore of questionable value for individuals. Examining the two parts of the indicator reveal the problem. First, relying only on weight, without qualifying the weight’s nature, ignores the factors that contribute to weight. It therefore fails to distinguish a robustly healthy individual, such as my female friend who is a champion powerlifter, and someone who’s clinically obese. That is, the equation treats 1 kg of muscle as identical to 1 kg of adipose tissue (“fat”). Second, height is a linear measure, which is then squared to represent an area measure. Yet bodies are three-dimensional, and height is a poor proxy for that complexity. Squaring the height term exacerbates this problem.
The result is what I call “a garbage metric”—one that is applied outside the purpose for which it was designed or poorly designed in the first place. It seems to measure something important, but only indirectly describes the thing being measured. BMI can indeed reveal something important, such as the consequences of poor diet and insufficient activity in a population. But is not, by itself, sufficient to confirm the problem in an individual.
Note: I chose the term “garbage” based on the famous computer science maxim that if your input data is “garbage”, your output (conclusion) is also likely to be garbage.
Consider a second example, which most of us have experienced during a visit to our doctor to mitigate pain. Doctors generally ask us to describe the pain’s intensity. In North America, this is commonly done using a pain scale from 1 (a minor annoyance) to 10 (the worst pain the patient can imagine). The problem should be clear: if you’ve been fortunate in living a largely pain-free life, the amount of pain you can imagine is limited, whereas if you suffer from chronic severe pain, you can imagine pain that a pain-free individual could never imagine. If you’ve experienced a kidney stone or childbirth, you can imagine far worse pain than someone whose worst pain was caused by a bruise or headache. Moreover, the most common version of this scale lacks definitions for intermediate values, making it impossible to reliably assign intermediate values to a patient; asking the same question about exactly the same amount of pain will result in different numerical values each time. Another garbage metric!
Consider, instead, a pain metric that is based on the impact on the patient. This revised scale could use the same range of values (0 to 10), but might include the following categories:
· 0 = no pain
· 1 to 3 = I only noticed the pain because you asked.
· 4 to 7 = I feel enough pain that I cannot perform a normal activity, such as bending over to touch my toes.
· 7 to 9 = The pain is so severe that I am having a hard time breathing.
· 10 = Pain so intense that the patient couldn’t respond to the question.
This metric is much more useful because, in addition to clearly defining the meaning of the categories (so that asking the same question repeatedly will obtain approximately the same answer each time), it expresses the pain in terms that are consistent across patients and meaningful because they reveal the pain’s impact. After all, the goal of the question is to learn what the pain means to the patient so you can decide how aggressively to treat it.
Another problem relates to the implied meaning of a metric. When you choose variable names, ensure that they reflect the meaning of the data. For example, many researchers use the conventions of binary logic to divide results into two categories, with 1 = yes or true or present and 0 = no or false or absent. This works well for binary choices (e.g., treated for pain versus not treated) because 0 represents the absence of a value, so any non-zero value must mean the presence of a value. (This would not be true for values that have multiple values between 0 and 1.0, such as correlation coefficients.)
There are potential problems with variable names that contradict the meaning of the variable’s value. If you use a variable named “response strength” with values ranging from 1 to 10, it’s clearer to use 1 (a low number) for a low strength and 10 (a high number) for a high strength. Using 1 = the highest strength and 10 = the lowest strength, an order used in athletic competitions is contradictory because a low score for an athlete (1) is associated with a high value (the highest strength or skill). This kind of mismatch between the variable name and the variable’s value encourages misunderstandings and interpretation errors. In my work as a scientific editor, I often see authors interpret their own data incorrectly because the scale they defined runs in the opposite direction to the meaning of the variable name.
The meaning of a number always depends on its context, and it’s unwise to forget that context when you develop metrics. Think very carefully about what you’re hoping to communicate. The fact that you’re creating a number is, by itself, unimportant. Without understanding the number’s meaning to yourself and your readers, you’re at high risk of creating a garbage metric.
無料メルマガ登録
これからも英語で論文を書く方向けに役立つコンテンツをお届けしていきますので、お見逃しのないよう、上記のフォームよりご登録ください。
もちろん無料です。
バックナンバー
第1回 if、in case、when の正しい使い分け:確実性の程度を英語で正しく表現する
第2回 「装置」に対する英語表現
第3回 助動詞のニュアンスを正しく理解する:「~することが出来た」「~することが出来なかった」の表現
第4回 「~を用いて」の表現:by と with の違い
第5回 技術英文で使われる代名詞のitおよび指示代名詞thisとthatの違いとそれらの使用法
第6回 原因・結果を表す動詞の正しい使い方:その1 原因→結果
第7回 原因・結果を表す動詞の使い方:その2 結果→原因
第8回 受動態の多用と誤用に注意
第9回 top-heavyな英文を避ける
第10回 名詞の修飾語を前から修飾する場合の表現法
第11回 受動態による効果的表現
第12回 同格を表す接続詞thatの使い方
第13回 「技術」を表す英語表現
第14回 「特別に」を表す英語表現
第15回 所有を示すアポストロフィー + s ( ’s) の使い方
第16回 「つまり」「言い換えれば」を表す表現
第17回 寸法や重量を表す表現
第18回 前置詞 of の使い方: Part 1
第19回 前置詞 of の使い方: Part 2
第20回 物体や物質を表す英語表現
第21回 句動詞表現より1語動詞での表現へ
第22回 不定詞と動名詞: Part 1
第23回 不定詞と動名詞の使い分け: Part 2
第24回 理由を表す表現
第25回 総称表現 (a, theの使い方を含む)
第26回研究開発」を表す英語表現
第27回 「0~1の数値は単数か複数か?」
第28回 「時制-現在形の動詞の使い方」
第29回 then, however, therefore, for example など接続副詞の使い方
第30回 まちがえやすいusing, based onの使い方-分詞構文
第31回 比率や割合の表現(ratio, rate, proportion, percent, percentage)
第32回 英語論文の書き方 総集編
第33回 Quality Review Issue No. 23 report, show の時制について
第34回 Quality Review Issue No. 24 参考文献で日本語論文をどう記載すべきか
第35回 Quality Review Issue No. 25 略語を書き出すときによくある間違いとは?
第36回 Quality Review Issue No. 26 %と℃の前にスペースを入れるかどうか
第37回 Quality Review Issue No. 27 同じ種類の名詞が続くとき冠詞は付けるべき?!
第38回 Quality Review Issue No. 22 日本人が特に間違えやすい副詞の使い方
第39回 Quality Review Issue No. 21 previous, preceding, earlierなどの表現のちがい
第40回 Quality Review Issue No. 20 using XX, by XXの表現の違い
第41回 Quality Review Issue No. 19 increase, rise, surgeなど動詞の選び方
第42回 Quality Review Issue No. 18 論文での受動態の使い方
第43回 Quality Review Issue No. 17 Compared with とCompared toの違いは?
第44回 Reported about, Approach toの前置詞は必要か?
第45回 Think, propose, suggest, consider, believeの使い分け
第46回 Quality Review Issue No. 14 Problematic prepositions scientific writing: by, through, and with -3つの前置詞について
第47回 Quality Review Issue No. 13 名詞を前から修飾する場合と後ろから修飾する場合
第48回 Quality Review Issue No. 13 単数用法のThey
第49回 Quality Review Issue No. 12 study, investigation, research の微妙なニュアンスのちがい
第50回 SinceとBecause 用法に違いはあるのか?
第51回 Figure 1とFig.1の使い分け
第52回 数式を含む場合は現在形か?過去形か?
第53回 Quality Review Issue No. 8 By 2020とup to 2020の違い
第54回 Quality Review Issue No. 7 high-accuracy data? それとも High accurate data? 複合形容詞でのハイフンの使用
第55回 実験計画について
第56回 参考文献について
第57回 データの分析について
第58回 強調表現について
第59回 共同研究の論文執筆について
第60回 論文の略語について
第61回 冠詞の使い分けについて
第62回 大文字表記について
第63回 ダッシュの使い分け
第64回 英語の言葉選びの難しさについて
第65回 過去形と能動態について
第66回 「知識の呪い」について
第67回 「文献の引用パート1」について
第68回 「文献の引用パート2」について
第69回 「ジャーナル用の図表の準備」について
第70回 「結論を出す ~AbstractとConclusionsの違い~」について
第71回 「研究倫理 パート1: 研究デザインとデータ報告」について
第72回 「研究倫理 パート2: 読者の時間を無駄にしない」について
第73回 「記号と特殊文字の入力」について
第74回 「Liner regression(線形回帰)は慎重に」について
第75回 「Plagiarism(剽窃)を避ける」について
第76回 研究結果がもたらす影響を考える
第77回 「データの解析(パート1):データ探索を行う」について
第78回 「データの解析(パート2):統計分析」について
第79回 「データの解析(パート3):データを提示する」について
第80回 データ、その他の大事なものをバックアップする(パート1)
第81回 「データ以外のもの(パート2)」について
第82回 「研究データと関連文書の管理(パート1):研究内容を文書で厳密に記録することがなぜ大切なのか」について
第83回 「研究データと関連文書の管理(パート2):必要なプロジェクトファイル、フォルダ(ディレクトリ)の構成とデータの消去
第84回 研究データと関連文書の管理(パート3):データ検証とカスタム開発ソフトウェア
第85回 研究データと関連文書の管理(パート4):ファイルの複製
第86回 「科学において有効な方法は仮説検定(hypothesis testing)だけではない」について
第87回 「スプレッドシートを安全に使う」について
第88回 「変数と数学記号の命名と入力: パート 1: 変数の命名」について
第89回 「変数と数学記号の命名と入力: パート 2: 変数の書式設定」について
第90回 「*誤った*精度:パート1:精度と正確度」について
第91回 「*誤った*精度:パート2:統計的確率」について
第2回 「装置」に対する英語表現
第3回 助動詞のニュアンスを正しく理解する:「~することが出来た」「~することが出来なかった」の表現
第4回 「~を用いて」の表現:by と with の違い
第5回 技術英文で使われる代名詞のitおよび指示代名詞thisとthatの違いとそれらの使用法
第6回 原因・結果を表す動詞の正しい使い方:その1 原因→結果
第7回 原因・結果を表す動詞の使い方:その2 結果→原因
第8回 受動態の多用と誤用に注意
第9回 top-heavyな英文を避ける
第10回 名詞の修飾語を前から修飾する場合の表現法
第11回 受動態による効果的表現
第12回 同格を表す接続詞thatの使い方
第13回 「技術」を表す英語表現
第14回 「特別に」を表す英語表現
第15回 所有を示すアポストロフィー + s ( ’s) の使い方
第16回 「つまり」「言い換えれば」を表す表現
第17回 寸法や重量を表す表現
第18回 前置詞 of の使い方: Part 1
第19回 前置詞 of の使い方: Part 2
第20回 物体や物質を表す英語表現
第21回 句動詞表現より1語動詞での表現へ
第22回 不定詞と動名詞: Part 1
第23回 不定詞と動名詞の使い分け: Part 2
第24回 理由を表す表現
第25回 総称表現 (a, theの使い方を含む)
第26回研究開発」を表す英語表現
第27回 「0~1の数値は単数か複数か?」
第28回 「時制-現在形の動詞の使い方」
第29回 then, however, therefore, for example など接続副詞の使い方
第30回 まちがえやすいusing, based onの使い方-分詞構文
第31回 比率や割合の表現(ratio, rate, proportion, percent, percentage)
第32回 英語論文の書き方 総集編
第33回 Quality Review Issue No. 23 report, show の時制について
第34回 Quality Review Issue No. 24 参考文献で日本語論文をどう記載すべきか
第35回 Quality Review Issue No. 25 略語を書き出すときによくある間違いとは?
第36回 Quality Review Issue No. 26 %と℃の前にスペースを入れるかどうか
第37回 Quality Review Issue No. 27 同じ種類の名詞が続くとき冠詞は付けるべき?!
第38回 Quality Review Issue No. 22 日本人が特に間違えやすい副詞の使い方
第39回 Quality Review Issue No. 21 previous, preceding, earlierなどの表現のちがい
第40回 Quality Review Issue No. 20 using XX, by XXの表現の違い
第41回 Quality Review Issue No. 19 increase, rise, surgeなど動詞の選び方
第42回 Quality Review Issue No. 18 論文での受動態の使い方
第43回 Quality Review Issue No. 17 Compared with とCompared toの違いは?
第44回 Reported about, Approach toの前置詞は必要か?
第45回 Think, propose, suggest, consider, believeの使い分け
第46回 Quality Review Issue No. 14 Problematic prepositions scientific writing: by, through, and with -3つの前置詞について
第47回 Quality Review Issue No. 13 名詞を前から修飾する場合と後ろから修飾する場合
第48回 Quality Review Issue No. 13 単数用法のThey
第49回 Quality Review Issue No. 12 study, investigation, research の微妙なニュアンスのちがい
第50回 SinceとBecause 用法に違いはあるのか?
第51回 Figure 1とFig.1の使い分け
第52回 数式を含む場合は現在形か?過去形か?
第53回 Quality Review Issue No. 8 By 2020とup to 2020の違い
第54回 Quality Review Issue No. 7 high-accuracy data? それとも High accurate data? 複合形容詞でのハイフンの使用
第55回 実験計画について
第56回 参考文献について
第57回 データの分析について
第58回 強調表現について
第59回 共同研究の論文執筆について
第60回 論文の略語について
第61回 冠詞の使い分けについて
第62回 大文字表記について
第63回 ダッシュの使い分け
第64回 英語の言葉選びの難しさについて
第65回 過去形と能動態について
第66回 「知識の呪い」について
第67回 「文献の引用パート1」について
第68回 「文献の引用パート2」について
第69回 「ジャーナル用の図表の準備」について
第70回 「結論を出す ~AbstractとConclusionsの違い~」について
第71回 「研究倫理 パート1: 研究デザインとデータ報告」について
第72回 「研究倫理 パート2: 読者の時間を無駄にしない」について
第73回 「記号と特殊文字の入力」について
第74回 「Liner regression(線形回帰)は慎重に」について
第75回 「Plagiarism(剽窃)を避ける」について
第76回 研究結果がもたらす影響を考える
第77回 「データの解析(パート1):データ探索を行う」について
第78回 「データの解析(パート2):統計分析」について
第79回 「データの解析(パート3):データを提示する」について
第80回 データ、その他の大事なものをバックアップする(パート1)
第81回 「データ以外のもの(パート2)」について
第82回 「研究データと関連文書の管理(パート1):研究内容を文書で厳密に記録することがなぜ大切なのか」について
第83回 「研究データと関連文書の管理(パート2):必要なプロジェクトファイル、フォルダ(ディレクトリ)の構成とデータの消去
第84回 研究データと関連文書の管理(パート3):データ検証とカスタム開発ソフトウェア
第85回 研究データと関連文書の管理(パート4):ファイルの複製
第86回 「科学において有効な方法は仮説検定(hypothesis testing)だけではない」について
第87回 「スプレッドシートを安全に使う」について
第88回 「変数と数学記号の命名と入力: パート 1: 変数の命名」について
第89回 「変数と数学記号の命名と入力: パート 2: 変数の書式設定」について
第90回 「*誤った*精度:パート1:精度と正確度」について
第91回 「*誤った*精度:パート2:統計的確率」について



