G検定対策 重要用語集②
AIを体系的に学びたいなら、G検定取得を目指すのが最も手っ取り早いと思います。
重要用語②です。試験対策などにご利用ください。
単語 | 内容 |
mecab | 形態素解析ツール。単語に分類する |
julius | 音声のフレームワーク |
OpenNLP | 自然言語処理のライブラリ |
鞍点 | 機械学習において重みの計算の際、ある次元から見ると、最小値であるが、別の次元から見ると最大値となるような点 |
F値 | 機械学習の2値分類問題における性能指標について、「適合率」と「再現率」がトレードオフ関係にあるために導入されたこれらの調和平均の名称 |
ILSVRC | イメージネット画像認識コンテスト |
LeNet ルネット | 元祖CNN ヤンルカンが開発。ヤンルカンはFacebookが招聘 |
AlexNet | ILSVRC2012でSVNに代わり圧倒的勝利。SuperVision DNN ディープニューラルネットワーク LeNetの改良版 |
GoogLeNet | ILSVRC2014で優勝したネットワーク。複数の畳み込みフィルタを並列に用いる。 |
VGG | オックスフォード大学が提案し、ILSVRC2014で準優勝したネットワーク。3×3の畳み込みをひたすら積み上げ。 |
ResNet | 入力層まで勾配値がきちんと伝わり、残差学習を行う152層のマイクロソフトが提案し、ILSVRC2015で優勝したネットワーク |
Global Average Pooling | 全結合層の代替。最終層の平均プーリングをsoftmaxに。全結合層のパラメータ集中を回避 |
ImageNet | 一般物体認識のデータセット。これを転移学習に使用可能。スタンフォード大学がインターネット上から画像を集めて分類 |
ディープラーニング | 確定的モデルと、確率的モデル(深層ボルツマンマシン・深層信念ネットワーク)がある |
adversarial example | 学習済のディープニューラルネットモデルを欺くように人工的に作られたサンプル |
強いAI 弱いAI | 人間の思考プロセスを模倣としようという試み。強いAI→AGI |
Memory Networks | 自然言語処理。国語の読解問題を解く、LSTM以上の長期記憶。PassageとQuestionとAnswerのペアを学習、未知なるPassageとQuestionのペアを渡すと、Answerを返す |
ResNet | ILSVRC 2015で優勝。152層 |
Squeeze and excitation | ILSVRC2017で優勝したニューラルネットワーク |
t-SNE | |
再帰ニューラルネットワーク | RNN。内部に閉路、ループ構造を持つ。時系列データを扱える。 |
時系列分野 | 主な研究分野は、自然言語処理(NLP)と、音声処理 |
隠れマルコフモデル(HMM) | 音声認識について、音自体を判別するための音響モデル |
Nグラム法 | 音声認識について、語と語のつながりを判別する言語モデル |
transformer | 2017年末に自然言語処理分野にパラダイムシフトを起こす。RNNベースでなくAttentionベース |
Attention | 時間の重みを学習する手法。過去のどの時点が重要なのかを表現する手法 |
LDA | 自然言語処理において、文中の単語から何がトピックかを推定する教師なし機械学習手法 |
bag-of-words | 自然言語処理において、文章に単語が含まれているかを考えてテキストデータを数値化する |
TF-IDF | 自然言語処理において、文章中の各単語の重要度を他の文章をまたいでどれだけ出てきているか、出現頻度で判定 |
word2vec | 単語の意味関係をベクトル(fastText)で表現。「王」ー「男性」+「女性」=「女王」を自動計算。自然言語処理。2013年にGoogleが論文。 |
SAE J3016 | 自動運転のレベルの定義のことで、米国の団体が定義 |
自動運転レベル0 | 人間の運転者がすべて行う |
自動運転レベル1 | システムがステアリング操作、加減速のどちらかをサポート(運転支援) |
自動運転レベル2 | システムがステアリング操作、加減速のどちらもサポート(運転支援) |
自動運転レベル3 | 特定の場所でシステムが全てを操作、緊急時はドライバーが操作(自動運転) |
自動運転レベル4 | 特定の場所でシステムが全てを操作(自動運転) |
自動運転レベル5 | 場所の限定なくシステムが全てを操作(完全自動運転) |
DARQ | ブロックチェーン、人工知能、拡張・強化現実、量子コンピュータの4つのテクノロジーを指す。アクセンチュアが発表 |
Maas | あらゆる交通手段をニーズに合わせてパッケージ化して提供するサービス |
Xaas | 情報処理に用いられる何らかのコンピューティングリソースを、インターネットを通じたサービスとして提供すること |
Cycシステム サイクシステム | 一般常識をデータベース化。人間同等の推論システム構築が目的。世の中の全てをモノ・コト、その感関係性を文章で記述。2001年OpenCycで一部を公開 |
BigGAN | 幅:512、高さ:512ピクセルの高解像度画像を条件付きで生成できる歴史史上最強のGAN |
VQ-VAE-2 | 2019/6にDeep mind社より発表。GANを使わずにHD大の画像を生成。 |
BERT | 自然言語処理における言語モデル。transformerをベースとした移転学習。2018/11にGoogleから発表 |
XLNet | 2019/6にArxivに投稿された。Transformerの一種を元の順序情報は保持しつつ単語の順序を入れ替えたことで自己回帰モデルで双方向の意味依存関係を取得できるようになった |
ブートストラップサンプリング | 決定木に対して対してランダムに一部のデータを取り出して学習に用いること |
深層信念ネットワーク | 制限付きボルツマンマシンを用いたネットワーク |
TensorFlow | ディープラーニングのフレームワーク。深層学習ライブラリ。ラッパーはkeras。Googleが公開 |
Chainer | ディープラーニングのフレームワーク。国産のフレームワーク。Define-by-Run方式を採用 |
PyTorch | ディープラーニングのフレームワーク。PreferredNetworks社が開発。Define-by-Run方式を採用 |
TPU | Googleが開発したテンソル計算処理に最適化した演算処理装置。GPGPUに代わる。 |
ベイズ最適化 | ハイパーパラメータ効率的に決定するための方法。過去の試行結果から次に行う範囲を確率分布で計算。グリッドサーチより早い |
グリッドサーチ | 適切だと考えられるパラメータを複数用意し、それらの値の組み合わせを全通り総当たりで行い、最も良いハイパーパラメータを探す方法 |
Xavier | シグモイド関数のデータ分布初期値 |
He | ReLUのデータ分布初期値 |
深層強化学習 | ディープラーニングと強化学習をあわせた分野 |
DQN | 深層強化学習。Deep LearningとQ学習を組み合わせた技術。 |
Alpha Go | DeepMind社がDQNで開発。当時の名声高いプロ棋士を破り世間を賑わせた |
Alpha Zero | Alpha Goを上回る性能。自己対局のみで学習。人間を超える強さ |
Chainer | 国産の人工知能フレームワーク |
VAE | オートエンコーダを応用した生成モデルで、画像を生成することができる |
分散表現 | 単語をベクトルで表現すること |
seq2seq | フリーテキストを入力とし、フリーテキストを出力するエンコーダRNNとデコーダRNNを用いたモデル |
順伝播型ニューラルネットワーク | FFNN、CNN |
リカレント(再帰型)ニューラルネットワーク RNN | 内部に閉路(ループ構造)をもち、時系列データを扱うことができるネットワーク。長期の過去データの保存は出来ない。 |
End to Endモデル | 音声認識について、RNNを使用し、音響特徴量から音素、文字列に直接変換する。 |
LSTM | 長期の過去データの保存。メモリーセル・入力・出力忘却ゲートからなる。自然言語処理としてGoogle翻訳が使用。 |
GRU | LSTMをシンプルにして、計算コストを抑えたもの。LSTMよりパラメータ数が抑えられているため学習が早い。 |
画像キャプション | 画像処理と自然言語の融合。画像はCNNに入力し、特徴をLSTMに入力し自然言語を生成する、 |
インダストリー4.0 | ドイツの製造業におけるオートメーション化およびデータ化・コンピュータ化を目指す昨今の技術的コンセプトに付けられた名称 |
中国製造2025 | 中国が掲げる産業政策。次世代情報技術や新エネルギー車など10の重点分野と23の品目を設定し、製造業の高度化を目指す |
GDPR | 欧州議会・欧州理事会および欧州委員会が欧州連合 (EU) 内の全ての個人のためにデータ保護を強化し統合することを意図 |
MNIST | 手書き文字認識のためのデータ・セット。全部で7万枚。アメリカの国立標準技術研究所によって提供 |
CIFAR10 | 一般物体認識のためのデータセット |
物体検出 | 対象物がどこにあるのかボックスで切り取り、推定するタスク |
RCNN R-CNN | 物体検出の先駆け的存在。 |
YORO | 物体の領域候補を選ばず、一気に物体検出を行う。 |
物体セグメンテーション | 対象物体と背景をピクセルごとに切り分けて、推定するタスク |
UNet U-Net | 画像認識でセグメンテーションを行えるモデル。畳み込みで特徴を抽出し、逆に畳み込みで領域を戻す。 |
Mask R-CNN | 物体検出で得られた領域に対してのみ、セグメンテーションを行う。 |
AGI | 強いAIを指す |
SHRDLU | 仮想空間において、積み木を積んだり下ろしたりを英語で指示できる |
STRIPS | 自動計画に関する人工知能システム |
中国語の部屋 | 中国語を話せない人を英語と中国語の対応マニュアルを持たせて部屋に閉じ込めて、外から中国語の作業させる思考実験 |
ELMo | 双方向リカレントネットワークにより実現された単語埋め込みモデル |
PCA | 機械学習で、分散が最大になる方向に新しい軸を定義しその軸にデータをマッピングしていくことで次元圧縮を実現する手法 |
協調フィルタリング | EC2サイトで購入履歴からユーザの嗜好に関してユーザどうしの類似性を判定し、リコメンド技術 |
WaveNets | Text to Speechにおけるブレイクスルー。RNNでなくCNNがベース |
WaveNets | 人工知能研究路線の一つ。言語データによるRNNや映像データからの概念知識理解を目指す路線 |
UC Berkeley路線 | 人工知能研究路線の一つ。実世界を対象に研究を進め、知識理解を目指す路線 |
Deep Mind路線 | 人工知能研究路線の一つ。オンライン空間上でできることをターゲットにして、知識理解を目指す。 |
フレームワーク | ディープラーニングを実装するには、あらかじめ定義されたフレームワークを利用するのが一般的 |
設定ファイルのフレームワーク | テキストで設定できるため容易だが、RNNなど複雑なモデルを扱うのは難しい。Caffe や CNTK。 |
プログラムのフレームワーク | 複雑なモデルも扱えるが、フレームワーク特有のソースコードで記述。TensorFlow やChainer |
最小二乗法 | 残差を用いてパラメータを推定する手法。モデルの予測値と実データの差が最小になるような係数パラメータを求める方法。 |
最尤推定法 | 残差を用いある係数パラメータが与えられたときに,モデルが実データを予測する確率(尤度)を最大化するような係数パラメータを求める方法てパラメータを推定する手法。 |
残差 | モデルによって出力された値と実際の測定値の誤差 |
waymo | 直接レベル3以上の自動運転化を目指すGoogle傘下の企業 |
Coursera | 入門から上級まで様々なレベルの AI 講義が開講されている |
リストワイズ法 | 欠損値への対応について、欠損あるサンプルを直接削除すること。 |
回帰補完 | 欠損値への対応について、欠損しているある特徴量と相関している他の特徴量で補完 |
マッピング | ドリンクのサイズ S, M, L などの順序を持つ文字列のカテゴリーデータの場合,それぞれの値に対応する数値を辞書型データで用意し,これを数値に変化する方法 |
ワンホットエンコーディング | 順序を持たない名義特徴量のカテゴリーデータについては,各変数に対応したダミー変数を新たに作り出す |
雑音・残響抑圧 | 音声を認識したい対象とそれ以外の雑音に分離する |
音素状態認識 | 音声の周波数スペクトル,すなわち音響特徴量をインプットとして,音素状態のカテゴリに分類する. |
ノーフリーランチ定理 | 機械学習でデータモデルを作成する事を考えた時、あらゆるデータセットに万能なアルゴリズムは存在しない |
次元の呪い | 特徴量の数が増えれば増えるほど、指数関数的に問題が複雑になっていく |
醜いアヒルの子定理 | それぞれの特徴は、同じくらいの特徴量(違い)を持つため、容易には見分けられない |
モラベックのパラドックス | 高度な推論よりも感覚運動スキルの方が多くの計算資源を要する |
バーニーおじさんのルール | モデルのパラメータ数の10倍のデータ数が必要 |
新産業構造ビジョン | 日本のAI の研究開発戦略 |
RAS 2020 戦略 | イギリスのAI の研究開発戦略 |
デジタル戦略2025 | ドイツのAI の研究開発戦略 |
インターネットプラスAI3年行動実施法案 | 中国のAI の研究開発戦略 |
コメント