G検定対策 重要用語集

G検定対策 重要用語集

AIを体系的に学びたいなら、G検定取得を目指すのが最も手っ取り早いと思います。
G検定対策では実務で機械学習を扱っていない人にとっては馴染みのない単語も多く出題されます。自分へのメモも兼ねてまとめてみました。

スポンサーリンク

著名人の言葉

氏名項目内容
アーサー・サミュエル機械学習明示的にプログラムしなくても学習する能力をコンピュータに与える研究分野
レイ・カーツワイルシンギュラリティシンギュラリティは2045年に到来する
イーロン・マスクシンギュラリティ非営利のAI研究組織OpenAI設立
スティーブン・ホーキングシンギュラリティAIの完成は人類の終焉を意味するかもしれない
ヤン・ルカンGAN機械学習において、この10年間で最もおもしろいアイデア

定理

定理発言者内容
ノーフリーランチ定理機械学習でデータモデルを作成する事を考えた時、あらゆるデータセットに万能なアルゴリズムは存在しない
次元の呪いリチャード・ベルマン特徴量の数が増えれば増えるほど、指数関数的に問題が複雑になっていく
醜いアヒルの子定理それぞれの特徴は、同じくらいの特徴量(違い)を持つため、容易には見分けられない
モラベックのパラドックスモラベック高度な推論よりも感覚運動スキルの方が多くの計算資源を要する
バーニーおじさんのルールモデルのパラメータ数の10倍のデータ数が必要

重要用語

単語年代人名内容
人工知能(AI)ジョン・マッカーシーダートマス会議でジョン・マッカーシーが初めて使った言葉
ダートマス会議1956年
ENIAC(エニアック)1946年アメリカのペンシルベニア大学で誕生した世界初の汎用電子式コンピュータ
ロジック・セオリストアレン・ニューウェル ハーバード・サイモンダートマス会議で披露した世界初の人工知能プログラム
第1次AIブーム1950年代後〜1960年代推論や探索を主とする。トイプロブレムしか解けない
第2次AIブーム1980年代知識の量を主とする。エキスパートシステム
第3次AIブーム2010年以降機械学習や特徴表現学習を主とする
トイ・プロブレム定理の証明や機械翻訳などの簡単な問題。第1次AIブームの終焉
エキスパートシステム「知識ベース」と「推論エンジン」から構成。知識が豊富になると蓄積/管理の手間が膨大。
ディープラーニングニューラルネットワーク(パーセプトロン)多層化。3層以上多層化しても高まらない。バックプロパゲーションやオートエンコーダで解決
AlphaGoDeppmind社が開発した囲碁の対戦プログラム。囲碁のトップ棋士を破る
人工無脳チャットボット、おしゃべりボット
ELIZA(イライザ)1964~1966年ジョゼフ・ワイゼンバウム人工無脳の元祖
MYCIN(マイシン)1970年スタンフォード大学で開発されたエキスパートシステム。診断支援、専門外の医師より高い正答率を達成
DENDRAL1960年代エドワード・ファイゲンバウム未知の有機化合物を特定するシステム
オントロジー「語彙」「意味」「関係性」を他者と共有できるように定められた概念化の仕様
ヘビーウェイトオントロジー人間が関わることになる傾向が強く、時間的/金銭的コストがかかる
ライトウェイトオントロジー深い考察を行わないことから、コンピュータが自動的に実行できる
ワトソンIBMが開発した質問応答システム。Wikipediaの情報を元にライトウェイトオントロジーを生成
東ロボくん2011~2016年質問の意味を理解していないため読解力に乏しく、技術的ブレイクスルーが必要とされ凍結
ニューラルネットワーク人間の神経回路を模倣してネットワークを形成。ニューロンの代わりにパーセプトロンを使用
パーセプロトロン1958年フランク・ローゼンブラットニューラルネットワークの元祖。ロジスティック回帰。
ロジスティック回帰2クラス分類。教師あり。対数オッズを重回帰で予測。ロジット変換。
オートエンコーダ(自己符号化器)教師なし学習。隠れ層は入力層・出力層に比べて次元が小さい
フレーム問題1969年ジョン・マッカーシー パトリック・ヘイズ実行しようとしていることと関連がある事柄を選び出すことが難しいという人工知能研究最大の難問
チューリングテストアラン・チューリング遠隔地にいる人間がコンピュータと会話し、コンピュータと見抜けなければ知能があると判断
中国語の部屋ジョン・サールチューリングテストに合格しても知能があるかはわからない」ことを示すための例え話
シンボルグラウンディング問題スティーブン・ハルナッド「シンボル(記号)と対象がいかにして結びつくか」という問題。フレーム問題同様、人工知能の難問。
知識獲得のボトルネック一般常識のような暗黙的かつ膨大な知識をすべてコンピュータに入れることは不可能であること
特徴量表現学習ディープラーニングで使用する特徴量をコンピュータ自身が見つけだすアプローチ
ラッソ回帰教師あり学習で用いられるモデルの一つ。線形回帰にL1正規化を加えた手法
リッジ回帰教師あり学習で用いられるモデルの一つ。線形回帰にL2正規化を加えた手法
ロジスティック回帰教師あり学習。回帰ではなく分類に使用される
シグモイド関数2種類を分類する際に用いられる関数。0から1の間に写像し、trueかfalseかで見分ける
ソフトマックス関数3種類以上を分類したい際にシグモイド関数に代えて用いられる関数
ランダムフォレスト着目する特徴量をランダムに決定してその特徴量ごとに決定木を生成する手法
アンサンブル学習全体から一部のデータを用いて、複数のモデルで学習させること
バギング全体から一部のデータを用いて、複数のモデルで並列に学習させること。
ブースティング全体から一部のデータを用いて、複数のモデルで逐次的に学習させること。精度は高いが、学習に時間がかかる
サポートベクターマシンパターン分類を行う手法。扱うデータが高次元かつデータが線形分類できない問題を持つが、高次元に写像することで分類が可能
マージン最大化サポートベクターマシンで距離が最大となるような境界を求めること
カーネル関数SVMで写像に用いられる関数
カーネルトリックSVMでカーネル関数を用いて写像すること
k-means教師なし学習。入力データからk個のグループ構造を見つけ出してまとめる手法
強化学習教師なし学習。次元削減
交差検証データを分割して評価を行うこと
混同行列項目が「犬」と「狼」ならば「予測が犬、実際が犬」「予測が犬、実際が狼」「予測が狼、実際が犬」「予測が狼、実際が狼」といった4通りの図となる
真陽性陽性側で予測値と実際の値が一致した組み合わせ
偽陽性陽性側で予測値と実際の値が一致しなかった組み合わせ
真陰性陰性側で予測値と実際の値が一致した組み合わせ
偽陰性陰性側で予測値と実際の値が一致しなかった組み合わせ
正解率全データ中どれだけ予測が当たったかの割合
適合率予測が正の中で実際に正だった割合
再現率実際に正であるものの中で、正だと予測できた割合
F値適合率と再現率の調和平均
過学習訓練データに最適化され過ぎてしまい、汎化性能が悪い状態
アンダーフィッティング訓練データを正規化しすぎてしまい、全体の汎化性能が低下した状態
正規化データを0から1に収まるようにスケーリングすること
L1正規化一部のパラメータの値をゼロにする正規化。特徴選択が可能
L2正規化パラメータの大きさに応じてゼロに近づける正規化。汎化されたなめらかなモデルを得ることが可能
正則化過学習を抑制するための手法
標準化平均を0に、分散を1に変換すること
PARRYELIZA同様初期の会話ボット
RFC439ELIZAとPARRYの会話が残っているRFC
ニューロンニューラルネットワークで使用される予測器。ニューラルネットワークの最小単位
基礎集計前処理さらに前にデータの傾向を把握するために行う作業
特徴量エンジニアリング  データからモデルが認識しやすい特徴を作ること
one-hot-encodingカテゴリカル変数をカテゴリカル変数であると分かる形に変換すること
スラック変数サポートベクターマシンで誤分類を許容する程度
勾配下降法関数を最小化させる。
局所最適解周辺では誤差の値が小さいが、最小値を実現するわけでもない解
大域的最適解誤差の値を最も小さくする解
停留点局所最適解でも大域的最適解でもないが勾配がゼロになる点
敵対的生成ネットワーク(GAN)イアン・グットフェロー教師なし学習。画像生成。生成ネットワークと、識別ネットワークからなる。
畳み込み層フィルタを積和演算+活性化関数の作用
プーリング層平均値、最大値を用いてサブサンプリングを行う
Word2Vec2013年Google単語をベクトルとして表現。単語の意味の近さを計算できる。
Kaggle(カグル)コンペティションやデータサイエンティストのディスカッションのプラットフォーム
Google Scholar学術論文の検索エンジン
Cousera(コーセラ)世界の大学の講義を受講できるオンライン講座
airXiv(アーカイブ)研究論文の検索エンジン
OpenAI Gym自分で制作した強化学習用アルゴリズムを試験できるAIシミュレーションプラットフォーム

学び
スポンサーリンク
mairoをフォローする
たまたまたまごTOWN

コメント

タイトルとURLをコピーしました