【歩行速度と寿命】論文読解に必要不可欠な「多変量データ解析」や「補正」についても概説!

 

アドホック
こんにちは。ドクターアドホックです。
ヘルシー
アシスタントのヘルシーです。
アドホック

皆さんは普段ある時のスピードを意識したことはありますか?

ヘルシー
正直あまり意識したことはありませんでした。
確かに街を歩いていると、颯爽と駆け抜けるように歩く人や、スマホ片手にゆっくり歩く人など、三者三様ですよね。

健康に運動が良いことは、皆さんも耳にタコができるほど聞いていることと思います。

特に会社の健診などで肥満や血糖高値、高血圧、LDLコレステロール・中性脂肪高値などを指摘されると、

あまりに数字が悪い結果の際には、すぐに医療機関での精査を指示されることもありますが、

多くの場合は運動などの生活習慣の改善を求められますよね。

ちなみに会社の定期健康診断で何らかの異常を認めた方のことを「有所見者」と呼びますが、

その割合をご存知でしょうか?

平成30年度定期診断結果 有所見率:55.5%

引用:政府統計の総合窓口 平成30年度定期診断結果

何と半分以上の方が何らかの異常を指摘されているということです。

話は戻りますが、「運動しましょう!」と言われたことのある人は多いのではないでしょうか?

そして「運動しなくちゃいけないのは理解しているのだけれども…」と口にして、結局何もせず…。

多くの方が心当たりのあるエピソードですよね?

アドホック

皆さんが運動を習慣にするのは難しいことはよく分かります!
そこで今日はそのような皆さんに、お手軽な運動として、意識して早くあることを提案をしたいと思います!

ヘルシー
早く歩くだけでいいんですか?
早歩きは効果的です。

ここではその医学的根拠まで解説しようと思います。

 

アドホック
はじめてこのブログを読まれる方にご案内です。
オススメの記事の読み方をご紹介しています。
未読の方はぜひご覧になってみて下さい!

この記事について
健康習慣として「ウォーキング」をご提案します。早歩きと寿命に関する医学論文を引用して、その医学的根拠をご紹介します。またこの記事では、「多変量解析」という医学論文で頻繁に用いられる解析手法を簡単に解説します。他の記事を読むときにも役立つ知識ですので、ぜひご期待ください!

歩行速度と死亡の関係について

歩くのが遅いと寿命が短い!?

2013年に「PLOS ONE」という「査読」付き学術誌に掲載された、歩く速さと死亡率との関連を検討した研究です。
アドホック
「査読」とは、専門家による評価や検証が行われたということです。
簡単に表現すると「専門家によるお墨付きあり」ということです。
なおこのブログでご紹介している医学関連の参考文献は、基本的に査読付き論文ですよ。

The analyses to follow are restricted to the 7423 men and 31,655 women who had complete data on BMI and walking pace, and whose deaths did not occur within one year of their baseline survey (97 deaths were excluded).

引用:Williams PT and Thompson PD. The relationship of walking intensity to total and cause-specific mortality. Results from the National Walkers’ Health Study. PLoS One. 2013.19;8(11):e81098.

「BMIや歩行速度のデータが揃った方で、また研究開始の調査時から1年以内に死亡していない方が対象となり、男性は7432人、女性は3万1655人になった」とのことです。
この対象者の方々を長年追跡していきます。
今回は寿命について考えていますので、対象者が追跡期間中に死亡したしまったかどうかが、重要な情報になります。その情報の取得方法としては下記の通りに記載されています。
The National Death Index identified 1968 deaths during the average 9.4-year mortality surveillance.
「平均で9.4年間の追跡中に、1968人の方の死亡がNational Death Indexで確認した」とのことですね。
National Death Index」というのはアメリカの健康情報データベースで、死亡状況に関する情報や、その場合の死因に関する情報を照会することができます。このような疫学研究では頻用されるデータベースになります。
では論文を確認しましょう!
Our 9.4-year follow-up of the National Walkers’ Health Study shows that a slower walking pace was significantly related to greater all-cause mortality, and mortality due to CVD, diabetes, nervous system diseases, and dementia.
「9.4年の追跡を実施したNational Walker’s Health Studyでは、歩行速度が遅いことは、全体の死亡率および心血管疾患や糖尿病、神経疾患、認知症による死亡率の上昇と有意に関連していた」というのが、この論文の結論になります。
「National Walker’s Health Study」というのは、研究の名前で、固有名詞です。
ヘルシー
結論を簡単に表現すると、「歩く速度が遅いと寿命が短い」といことですね。
大規模疫学研究から得られたこの結果で、その内容のインパクトも大きいですね!
ではもっと詳しく結果を見ていきましょう!

結果の詳細

男女別(上側が女性、下側が男性)に結果がまとめられています。
まずはこの結果について説明している本文を確認しましょう。

Figure 1 shows that a slower walking pace was significantly associated with greater risk for total (i.e., all cause) age- adjusted mortality in both males and females, with the association due primarily to greater mortality in the slowest (4th) pace quartile.

引用:Williams PT and Thompson PD. The relationship of walking intensity to total and cause-specific mortality. Results from the National Walkers’ Health Study. PLoS One. 2013.19;8(11):e81098.

「歩行速度が遅いことは男性および女性の両方にとって、有意に年齢調整をした死亡率の上昇リスクと関連しており、特にこの関連は、歩く速度が最も遅い人の死亡率の高さによるものであったということを図1は示している」ということです。

もう少し詳しく説明します。
男性も女性も、大きく4つのグループに分けられています。
これは歩く速さに応じて4段階に分けれていて、
「1st」というのは「最も早く歩く人」、「4th」というのは「歩くのが遅い人」に該当します。
縦軸は死亡のリスクです。数字が高いほど、死亡のリスクが上がることを意味します。
それぞれのグループは、黒色と灰色と白色に色分けされています。
アドホック
この色分けについて、この後のセクションで改めて解説します!
ここでは黒色の棒グラフだけに注目してみましょう!
歩行速度が最も早い人(グラフ左側:1st Fastest)と比較して、歩行速度が最も遅い人(グラフ右側:4th Slowest)のグラフも高さはどうでしょうか?
ヘルシー
歩く速度が最も遅い人は、棒グラフの高さが高くなっています!
最も早い人と比較して、死亡リスクが高いということですね!
アドホック
その通りです!
ヘルシー
歩く速さがこんなに重要だったなんて驚きました!
いかがだったでしょうか?
歩行速度が寿命と関連しているという結果を見ると、
今後の皆さんの歩くスピードを意識するようになりますよね!
ヘルシー
「鉄は熱いうちに打て」です!
今日の帰りから早歩きを心がけましょう!

「多変量データ解析」「補正」について

少し専門的な内容のセクションです。十分に理解ができなくても問題ありませんので、身構えずに気楽に目を通してみてください。

ではここから先は、統計に関する内容になります。

アドホック
難しく感じる部分もあるかと思いますが、一緒に頑張りましょう!
他の記事を読むときにも必ず役立つ知識です!

先ほどの論文の図で、黒色と灰色と白色に色分けされていましたね。

これは死亡のリスクを計算する際に、「補正」した項目の違いになります。

この「補正」という手法は、医学論文などの学術誌に頻繁に登場します。

そして「補正」をするためには「多変量データ解析」という統計解析が必要です。

初学者には難解なイメージで、馴染みのない言葉ばかりですが、

論文の内容を少しでも理解するために、知っておいて損はありません。

アドホック
もちろんこのブログでは、統計学の知識がない方でも論文の結果が理解できるように解説しています。ただ、実際に引用した論文の図や表の詳細を理解したい人や、自分で解釈したい人には、基本的な統計学の知識は有用です!
ここからの統計に関する説明は、理解しやすいよう簡略化して説明しますので、厳格な定義通りでない部分もあるかと思います。ご容赦いただきますようお願い申し上げます。

説明変数と目的変数

補正や多変量解析の話を進める前に、より単純な具体例から考えていきましょう!

今回の論文は、シンプルに考えると、下記の関係を明らかにすることでした。

「歩く速さと寿命の関係」はどうなっているか知りたい!というのが疑問です。

少し表現を変えると、「歩行速度で死亡のリスクを予測できるか?」という問いの答えを見つけたいということですね。

これから疑問の段階ですので、矢印は点線で表現しています。

ここで次の用語を覚えましょう!

説明変数:予測に用いる変数
目的変数:予測を行いたい変数
この場合は、繰り返しになりますが、「歩行速度で死亡リスクを予測したい」というのが目的です。
つまり「説明変数=歩行速度」「目的変数=死亡」になりますね。
また参考までに次の用語も覚えておいてください。
2つの変数がある場合において
回帰:一方から他方を予測すること

相関:両者の関連を評価すること
今回は、歩行速度で死亡リスクを予測したいので、「回帰」です。
アドホック
ここまでの内容は宜しいでしょうか?
次は説明変数の数を増やしてみましょう!

「補正」の必要性!

では話を進めていきましょう!
ではここで問題です。
「年齢」は「寿命」と関係がありますか?
答えは「関係あり」です。

「ご高齢になるほど寿命が短くなる」のは当然ですよね。

また若い方と比較して、ご高齢の方では、心疾患などの基礎疾患がある方の頻度が上がります。例えば「肺炎」に罹患した場合に、基礎疾患がある方が、重症化してしまい、致死率が上がります。また「がん」などの疾患に罹患する確率があがります。

では次の質問です。

「年齢」は「歩く速さ」と関係がありますか?
答えは「関係あり」です。

「ご高齢になるほど、歩く速さが遅くなる」ことは想像できますね。

ヘルシー
「歩行速度」と「死亡リスク」について考えていましたが、どうやら「年齢」の影響は無視できないですね?

「歩く速さ」と「死亡率」の関係に「年齢」が影響を与えることがお分かりいただけたと思います。

図示すると下のようなイメージです。

このように、調べたい変数の両方に関連する要因の影響をできるだけ取り除く必要がありますよね?

アドホック
ここは大事な点です!もう少し一緒に考えてみましょう!
ここからは仮定のお話をします!

データ収集をして統計解析したところ「歩行速度が遅い人ほど死亡率が統計学的有意に高い」という結果が得られたとします。

解析者としては満足ですよね。得られた結果を世の中に発信したくてウズウズしています!

ただ「年齢」の影響は考慮していない結果です。

本当に結果の通りに信用しても大丈夫でしょうか?

ヘルシー
具体的にはどういうことでしょうか?
アドホック
せっかく得られた結果ですが、「歩行速度が遅い人は高齢者が多い」ことは十分に予測されますよね?すると「歩行速度が遅い人ほど死亡率が統計学的有意に高い」という解析結果は、単に「高齢者は寿命が短い」ということを意味している可能性がありますよね?
下の図のような可能性を考えられませんか?
つまり「高齢者→歩行速度の低下→寿命が短い」という上段の矢印の説明をしているだけかもしれませんよね?
この場合は「高齢者→寿命が短い」ということの言い換えに過ぎません。
ヘルシー
そういうことですね!確かに「年齢」のことを考慮しないで得られた結果では、信頼度が下がるという意味がわかりました。色々な可能性が想起されますのもね!
考慮してあげることの大切さが分かりました!
アドホック
その通りです!そしてこの「考慮する」というのは、統計の世界では「補正する」とほぼ同義になります!
「補正」という言葉のイメージがついてきたでしょうか?
・「説明変数」と「目的変数」に影響する要因については、「補正」をする必要がある。

「補正」の方法は?「多変量データ解析」の登場!

では肝心の「補正」の方法を学びましょう!
早速結論から申し上げます。
補正したい説明変数を、注目している説明変数と同時に、統計解析する」ことで、
その影響を考慮することができます。
ヘルシー
解析方法を工夫するということですね。
ただ残念ながらイメージが湧きません…
まずは下のイメージ図を見てください。
年齢が死亡リスクと関連することは既に分かっていることですので、実践の矢印が示しました。
先ほどの模式図との違いは、年齢が「説明変数」と「目的変数」の間にあるのではなく、
説明変数の側に移動しているということです。
この場合、「歩行速度」と「年齢」の2つの説明変数で、「死亡」という目的変数を予測しようというモデルになります。
この説明変数が2つ以上になるとは、要因(変量)が複数となることで、つまり多変量を扱う解析となるのです。
多変量データ解析:目的変数の予測する際に、説明変数が複数ある場合の解析方法のこと
ヘルシー
なるほど!説明変数が複数になると多変量データ解析になるのですね!
そして、説明変数に補正したい要因を入れれば良いのですね!
ということは、「年齢」以外にも補正したい項目を追加しても大丈夫なのですか?
アドホック
その通りです!例えば「過去に心臓発作を起こしたことのある人」は、全く健康な人と比較して、心臓発作を再発して、最悪の場合は死に至ることもありますよね?
ヘルシー
ぜひ補正したいです!
ではこうしましょう!
ヘルシー
なるほど!説明変数を増やせばいいのですね!
多変量データ解析らしくなってきました!
アドホック
これは余談ですが、解析するモデルを決めてしまえば、実際の解析は統計ソフトが迅速に実行してくれますので、説明変数を増減させて解析することは難しくありません。どの要因を補正するか、その選択が最重要になります!

多変量データ解析の解釈方法

ここまでの簡単な復習です。

・「説明変数」と「目的変数」に影響する要因については、「補正」をする必要がある。
・「補正」を行うのに必要な統計解析が「多変量データ解析」である。

ではこの多変量解析をみたときの簡単な解釈の方法を学びましょう!

では「年齢」の補正が必要な理由をもう一度考えてみましょう!

「年齢が高いほど、歩行速度は遅くなるし、死亡リスクも高くなる」つまり「説明変数にも目的変数にも年齢が影響する」ことが問題であり、そのために補正を行うのでした。

アドホック
では質問です。
「同じ年齢の方々のみ対象にした場合に、歩行速度が遅いほど寿命が短い」という結果が得られたとします。この場合、得られた結果の信用度はどうですか?
ヘルシー
「年齢が同じ」ということですから、「高齢者→歩行速度の低下→寿命が短い」という関係は考えなくていいのですよね?ですので、信頼度は年齢を補正する前より格段に上昇します!
アドホック
補正することで結果の信頼度が上がりますよね!
補正するというのは、その項目については、条件が統一されていると考えます。補正した項目以外の要因同士の関連を見ている時は、その関連に補正した項目は影響しないという前提を、多変量データ解析として計算してくれます。

学んだことを生かして論文の図を再確認!

・「説明変数」と「目的変数」に影響する要因については、「補正」をする必要がある。
・「補正」を行うのに必要な統計解析が「多変量データ解析」である。
・注目している説明変数と目的変数の関係を見る際、「補正」した要因は条件を同一になるよう計算処理されている。つまり「補正」した要因は、他の説明変数や目的変数に影響しないと考えなくてよい。
ではもう一度、この記事で紹介した論文中の図を提示します。
図の「黒い棒グラフ」に注目しましょう!
これは年齢を補正した結果を表現しています。
グラフ中に「■ Age adjusted only」を記載されていますが、
これは「年齢の影響だけは補正しました」という意味になります。
ヘルシー
「年齢はそれぞれのグループで同じ」と考えた時に、歩行速度が一番早いグループと比較して、それぞれのグループの死亡リスクはどうなっているかを表現しているということですね!
では今度は「白い棒グラフ」を見てみましょう!
「◻️All covariates, no METh/d」と書かれていますが、
「運動強度の単位であるMET以外の全ての共変量は補正しました」という意味です。
「全ての共変量」とは具体的に、年齢に加えて、教育歴や喫煙歴、普段の飲酒量、肉やフルーツ摂取量、アスピリンの服用、心臓発作の既往のことで、これら全てが補正されているということになります。
ヘルシー
補正した要因がたくさんあり、まさに多変量データ解析という感じですね!
この補正が意味するところは、それぞれのグループの比較の際に、「各グループの年齢は同じ、教育歴も同じ、喫煙歴も同じ、普段の飲酒量も同じ、肉やフルールの摂取量も同じ、アスピリンの服用も同じ、心臓発作の既往も同じ」という条件の下、歩行速度と死亡リスクはどうなっているのかを検討した結果ということですね!
どうでしょうか?説明を見る前と後で、図の解釈が少しでも変わったでしょうか?
この「補正」という考えは非常に難しいですが、ぜひ概念を理解しておいてください。
なお「補正」が可能な統計解析方法は複数ありますが、
医学論文では次の名前を覚えておけばよいでしょう!
重回帰分析:目的変数が連続変数の場合に使用
(目的変数が連続変数で、説明変数にカテゴリー変数が入る場合には、共分散分析を用います)
ロジスティック回帰分析:目的変数がカテゴリー変数の場合に使用
Cox比例ハザードモデル:ロジスティック回帰分析+時間の概念
今回の論文は、対象者を年の単位で追跡して得られた結果であり、時間の概念が含まれています。
よって、Cox比例ハザードモデルが用いられています。
Hazard ratios (HR) from Cox proportional hazard analyses were used (後略)
「Cox比例ハザード解析によるハザード比が使用された」ということです。

まとめ

この記事の要点
・「歩く速さが早い方は寿命が長い!」という医学論文をご紹介。
・研究結果に影響を及ぼす要因を「補正」する目的は、統計解析を得られた結果を少しでも「真実」に近づけるため!
・論文中に「補正」が登場したら、その要因の数学的に考慮されていると考えましょう!
アドホック
お疲れ様でした。統計のパートはボリュームがありましたが、できるだけ概念をご理解いただけるように心がけました。
ヘルシー
論文読解以外にも、多くの場面で統計の知識は役立ちますよね!
レイジー
何となくしか分からなかったけど、気になるものは全部「補正」しておけば問題ないんでしょ!簡単じゃん!
ヘルシー
そんなに単純なのかな?
残念なことに、解析の段階でいくら統計解析を工夫しても、全ての因子を補正し尽くすことは現実的には難しいです…
「統計の結果は絶対に正しい、絶対に信用できる!」と過信は禁物です。
これだけは最後に覚えておいてください!
・歩くときは歩行スピードを意識!早歩きが長寿の秘訣!
アドホック
最後までお読みいただき、ありがとうございました!!
最新情報をチェックしよう!