機械学習を学ぶための準備 その2(級数と積分について)

Data Science

2015.12.2

Topics

機械学習を学ぶための準備
 その1(微分について)
▶︎その2(級数と積分について)
 その3(行列について)
 その4(行列の掛け算について)
 その5(行列のいろいろ)

橘と申します。
機械学習を勉強中の身でありながら、機械学習に関して記事を書いていく予定です。
前回の微分に引き続き、今回も機械学習の準備として「級数と積分」をテーマにご紹介していきます。

##########執筆後の言い訳#########
書き終わったところで「これってテックブログなのか?」という疑問が湧いてきてしまっているのですが、数学の記号が複雑に感じてしまう方もいらっしゃるかと思い、今回は記号の意味もふんだんに入れてみました。
##############################

級数が苦手な人が多い?

これは私のまわりに集中しているだけなのかもしれないのですが、「級数がよくわからない」という言葉を耳にします。もしくはΣ(シグマ)の記号がわかりづらさを助長しているのかもしれませんので、(特にエンジニアの方に)わかりやすいように説明していくつもりです。
※ 一般的には級数というと無限級数を表すのですが、ここでは一度有限級数のことを級数と呼ぶことにします。(無限は難しいためです。)

級数はエンジニアの殆どの人は使っている!?

級数とは、数の総和(Summation)を表します。(この時点で察しの良い方は、既に気づいているかもしれませんね!)
次のようなものです。
series

これをΣを使うと次のように表されます。
series2

なぜΣを使うかというと、ギリシャ文字の「Σ」はアルファベットの「S」に相当し、総和(Summation)の頭文字であることから、Σが使われています。(このことを知っていると、少しΣへの抵抗が少なくなるかもしれません・・・ね?)
1から10まで順番に足す・・・これってプログラミングの初心者用の問題でよく出ます。そうです、for文なんです。
series3

例えば、数列の和
series4

もfor文と考えれば自然に見えると思います。
series5

「級数はfor文で足しているようなもの」と捉えておけばとりあえずは十分です。

積分に入る前に

ところで、なぜ積分を使う必要があるのでしょうか?
機械学習はいくつもアプローチの方法があるのですが、いずれのアプローチの方法も統計学や確率論というものを基に成り立っています。統計学も確率論も、「分布」と呼ばれるデータの散らばり具合を表すものを使います。この「分布」を計算する際に「面積」を考えることになるのですが、この「面積」を求めるのに積分を使う必要が出てくるのです。

積分って

積分とはどういうものか、イメージが湧くでしょうか。もしかしたら、「微分の反対」というようなイメージで捉えている方もいらっしゃるかもしれません。ですが、ここでは「和」、つまり「足し算」として積分を考えてみることにします。
ところで、積分の記号って覚えていますか?積分の記号は「∫(インテグラル」という記号を使います。この「∫」、Sの形に似ていませんか?実は、先程のΣと同じように、和(Summation)のSを縦に伸ばしたものです。17世紀末にライプニッツという数学者によって使い始められました。ですので、和として積分を捉えることは的はずれなことではないのです。
では、どのようにして「和」としてとらえていくかというと、「面積を求める」という方法で考えていきます。そもそも積分は、面「積」を「分」けると書きます。三角形や四角形のように面積を求める公式があるものは辺の長さから計算できますが、ぐにゃぐにゃと曲がった線に囲まれた図形ではなかなか計算できません。
そこで、「面積を分ける」という考え方をしてみます。ただぐにゃぐにゃ曲がった線を積分するには、「無限」というものを考えなくてはならないため、ここでは階段状のグラフを考えてみる
ことにします。
integral1

上の図の赤い部分の面積を考えてみましょう。(小学校の時にやりましたね。)直感的に答えられる人もいるかもしれませんが、わかりづらいです。
ですが、下の図のように縦に分割して長方形にすれば、計算できそうです。
integral2

(※もし興味があれば、この面積の計算をΣで表してみるとより理解が深まるかもしれません。)
これを基に、次の曲線と下の直線との間の面積を求めてみます。
integral2.5

少しややこしい分割になりますが、各長方形の横幅は等間隔にして、縦幅を曲線と長方形の左上の角がぶつかるところ(図の黒点部分)として分割してみます。
integral3

すると、曲線と長方形の間に隙間があったり、曲線よりも長方形がはみ出してしまう部分が出てしまいます。これでは、正確に曲線と直線の間を分割できた、とは言えません。
そこで、もう少し各長方形の横幅を減らして、分割する数を増やしてみます。
integral4

すると、先程の図に比べて、足りなかったりはみ出している部分が減っているようです。
これをもっともっと長方形の横幅を減らす、つまり分割する数を増やすことでより曲線にフィットするような分割が作れそうです。
これが、(厳密さは五郎丸選手の正確なキックで飛ばしてもらっていますが、)積分です。
「ある区間の間の面積を分割し、分割された面積を足したもの」としてみることができます。
厳密には、「無限」に分割することで本当の積分となるのですが、それを知りたい方は専門書を呼んでいただいた方がいいかと思います。
ここでは、積分というのは「面積の和」であることを抑えておいていただければ十分です。

定積分と不定積分

最後に、積分には大きく分けて「定積分」と「不定積分」というものがあります。これまでの積分の説明で∫を使わなかったのには、今の段階ではうえでの説明の通り、「積分は分割した面積の割を求めるもの」ということを頭に入れてほしかったことにあります。ですが、ここからは∫を使って説明していきます。
定積分と不定積分は次のようなものです。
integral5

まず、定積分に関して紹介していきます。定積分は、∫の下と上に何らかの数字が入ります。上の図ではbとaが入っていますが、これは下から「aからbまで」と読みます。先ほど長方形に分割して面積を求めたときのことを思い出すと、「ある左側の地点からある右側の地点まで」を長方形で分割していました。この左側の地点aであり、右側の地点bです。つまり、定積分は「ある区間からある区間までの面積を求めるもの」とみなすことができそうです。(ちなみに、曲線の部分が定積分のf(x) の部分にあたります。)
では、不定積分とは一体何でしょうか。定積分のときのある区間を表すaやbのような数字がありません。実は、不定積分は「微分の逆の演算」という使われ方をします。「逆の演算」というのは、「足し算」に対する「引き算」、「掛け算」に対する「割り算」のようなものです。どういうことかというと、微分の回で、次のような高校の時に微分の計算方法を簡単にご紹介しました。
bibun

逆というのは、上の図の下から上、つまり「y’からy」を計算するときに使われます。「不定積分は、微分した式の元の式を求めるもの」として覚えてもらえれば十分です。注意として、厳密には積分定数という面倒な値が出てくるのですが、それは興味を持って微分積分の問題集を手にした時に苦労していただければいいかと思います。
今回は以上となります。

次回予告

次回は、行列について扱います。
行列は習ったことが無い方が多くいるかと思いますので、少し丁寧に解説したいと思います。

関連記事
機械学習を学ぶための準備 その3(行列について)

テックブログ新着情報のほか、AWSやGoogle Cloudに関するお役立ち情報を配信中!

編集部

AWSを中心としたクラウドインフラやオンプレミス、ビッグデータ、機械学習などの技術ネタを中心にご紹介します。

Recommends

こちらもおすすめ

Special Topics

注目記事はこちら