苦手意識を克服する!医薬翻訳者のための統計英訳講座
2018年度第2回JTF翻訳セミナー報告
苦手意識を克服する!医薬翻訳者のための統計英訳講座
小泉 志保
小泉 志保:神戸市外国語大学外国語学部国際関係学科卒業。医学・医薬翻訳者。主に治験関連文書のほか、文献等を手がける。翻訳学校等で講師も務める。日本翻訳者協会(JAT)理事、日本翻訳連盟(JTF)、日本メディカルライター(JMCA)協会会員。https://skmedical.jp
2018年度第2回JTF翻訳セミナー報告
日時●2018年8月30日(木)14:00 ~ 16:40
開催場所●剛堂会館
テーマ●苦手意識を克服する!医薬翻訳者のための統計英訳講座
登壇者●小泉 志保 Koizumi Shiho 医学・医薬翻訳者
報告者●茂貫 恵助(フリーランス翻訳者)
医薬、英訳、統計。この3つの単語を聞いてたじろぐ方は多いのではないだろうか。この日の東京の気温は34℃。それでも70名の参加者が一堂に会した。避けるのではなく、克服するために。
離婚率とシャーロック・ホームズ
何気ない暮らしの中にも統計があることを再認識する。
例えば打率、有病率、離婚率。この中で正確に「率」を表しているものは1つしかない。分子が分母に含まれ、一部の全体に対する比を表す「割合」と時間的変化に用いられ、分母の単位は時間である「率」を区別して翻訳する必要があるという。
また、シャーロック・ホームズの銀星号事件を用いて統計的検定に用いられる帰無仮説の説明がなされた。盗まれた名馬に関する名探偵の推理[(1)もし見知らぬ人が入ってきたら、犬は吠えたはずである(2)犬は吠えなかった(3)それゆえ、侵入者は犬にとって見知らぬ人ではなかった]が、帰無仮説H0の論理[(1)もしH0が成立していれば、計算した指標は「ある値」をとりやすい(2)手元のデータでその値が起こる可能性はとても少ない(3)それゆえ、H0が起こったとは考えず、H0が間違っていたと考える(つまりH0は棄却される)]と一致している。
3種類の測定値タイプから考える
統計が難しいと考える理由の1つに、統計手法を表す用語の多さが挙げられるのではないだろうか。本講座では測定値のタイプ別で3種類に分類することを試みている。1つ目は血圧などの「連続値」である。2つ目は「二値」である。例えば有害事象の有無がこれに該当する。3つ目は死亡など「イベントまでの時間」である。
手元にあるデータ(標本)のみで母集団の特徴を見積もる際に、2種類の推定「点推定」と「区間推定」が用いられる。母集団の特徴を1つの値で見積もるから点推定、幅を付けて見積もるから区間推定なのである。この点推定値を前述した3つのタイプに分類してみる。連続値には平均値の差、二値にはリスク比やオッズ比、イベントまでの時間にはハザード比がそれぞれ該当する。一方、区間推定といえば95%信頼区間が頻繁に用いられている。これは、100回同じ試験をすると母集団の特徴の値が95回の試験で入る区間を意味することも丁寧に確認された。
母集団の特徴を見積もるには検定という方法もある。統計的検定とは、前述した帰無仮説を手元のデータで否定する推測形式であり、その結果はp値という指標でまとめられる。p値が小さいほど帰無仮説を棄却すると解釈できる。主な検定についても、連続値はt検定、二値はカイ二乗検定、イベントまでの時間はログランク検定と分類でき、帰無仮説(有意差がない状態)が真であるとき、連続値の場合は母集団の平均値の差は0になり、二値の場合は母集団のリスク比は1、イベントまでの時間は母集団のハザード比も1となる。これらの値が95%信頼区間に含まれていなければ帰無仮説は棄却される。言い換えれば95%信頼区間に対応する有意水準0.05の両側検定の結果は有意差ありとなる。
回帰モデルも3つのタイプで分類できる。主なモデルとして、連続値では単回帰(線型回帰)モデル、二値ではロジスティック回帰モデル、イベントまでの時間はCox回帰モデルが用いられることが多い。回帰モデルでは交絡因子を調整した解析が可能であり、伝統的に使用されているt検定やログランク検定よりも便利である。
このように、3つの測定値タイプで分けるという画期的なアプローチの有用性が基本編で明解に説明された。
統計知識は細部に宿る
翻訳する者として統計を知っていれば、より適切な訳語を選択したい。紙面の都合上すべては紹介できないが、実践編で取り上げられた問題を下記に示す。前述した箇所をヒントに考えていただきたい。
問1:以下の和訳の誤りを正すと?
The study population will be enrolled as 3 cohorts.
試験対象母集団には、以下の3コホートを組み込む。
問2:以下を(英語・日本語とも)より正確に修正すると?
The 90% CI of the AUC0-inf included 1, whereas the 90% CI of the Cmax did not.
AUC0-infを指標とした場合、90% CIは1を含んだものの、Cmaxを指標とした場合、90% CIは1を含んでいなかった。
問3:下線部を別の動詞に置き換えると?
Logistic regression was used to calculate the odds ratios (ORs) of having unrecognized diabetes mellitus across the four groups.
解答1
母集団→集団。母集団とは考察の対象となる特性を持つ集団全体を指すため、解析対象集団として用いることができない。
解答例2
英語:of the AUC0-inf → for the ratio of the AUC0-inf、of the Cmax → for the ratio of Cmax/日本語:AUC0-infを→ AUC0-infの比を、Cmaxを→Cmaxの比を。何らかの比[幾何平均比(geometric mean ratio)等]に該当する語が入る。ライターは知っていることを前提に書いている。帰無仮説では1という数字が比を表していることは明らかなので、メディカル翻訳者としては前後の文脈を理解して正確に補いたいところだ。
解答3
calculate→estimateなど。英訳では動詞の選択が重要である。オッズ比は(点)推定値に用いられるという統計知識をもとに動詞を選択したい。普段から各語を言い換えられないか考え、使える表現を増やしておくことが英訳上達のコツであるという。
今注目のestimand
最近の製薬業界で活発に議論されているこの概念がどのように説明されるのか、興味を持って参加した方もいる。依頼を受けた最近の翻訳に登場したという方もいる。第3部の上級編と題し、登壇者の解説がさらに熱を帯びる。
2018年9月現在、ステップ3段階のICH E9 (R1)によると、新たな概念であるestimand(対応する日本語は現在ないのでこのように記載)とは、「試験の目的により提示された関心のある科学的疑問に対応する推定の対象」であり、「対象集団、変数、中間事象の取扱い及び集団レベルの変数の要約を規定することにより、特定の試験の目的に対する推定の対象(すなわち「推定されるべきもの」)を定義する」ものだ。つまり、estimandは対象集団、変数(評価項目)、中間事象、要約の4つで構成されている。注目すべきは中間事象で「治療開始後に発現し、変数を観測できなくする、又は変数の解釈に影響を与える事象」を表し、レスキュー薬など代替治療の使用や治療の中止、死亡等のイベントが挙げられる。ICHがこの概念を導入した背景には、これまで明確にされていなかった欠測値の取り扱いに対応することで研究・治験結果をよりリアルワールドに即したものにしようとする世界的な流れがある。
次に中間事象に対応するための5種類のストラテジーが紹介され、ストラテジーを選択後に各ストラテジーに則した具体的な解析方法が決定されるため、ストラテジーによって結果が変わることが強調された。さらに概要(Synopsis)への記載例が紹介され、実際の翻訳で遭遇しうる形で具体的に提示された。
おわりに
翻訳者として生き残るために何ができるか。統計は勉強すればするほど難しい。ただ、少しでも分かることで原文の理解度が違ってくる。1つでも多く統計を理解していれば、それがクライアントに伝わるものだ。講演者のまとめが、高橋さきの氏の翻訳スキルの成長曲線やカプラン‐マイヤーの生存曲線とオーバーラップする。
副題「非統計家の文系翻訳者による日本一無謀な統計記述部分の英訳講座」や関西からやってきた心境を表現したというランボーの画像から始まった2時間40分の講座。無謀でも乱暴でもなかったことは、登壇者に贈られた温かく盛大な拍手が物語っていた。