a16mixx– Author –
-
AI(ディープラーニング) how to
数学特化LLM:WizardMathの作り方【論文PDF翻訳サービス付】
【解説する論文】 WizardMath: Empowering Mathematical Reasoning for Large Language Models via Reinforced Evol-Instruct 既存研究の課題 大規模言語モデル(LLM)は、ChatGPTに代表されるように、自然言語処理において目覚ましい成果を上げています。... -
AI(ディープラーニング) how to
BingのChatGPTは検索結果も利用しているが、その仕組みに関連する論文
ChatGPTは学習に時間とコストがかかる為、最新のリアルタイム情報を学習する事は現時点で現実的ではない。その為、BingのChatGPTはChatGPTの出力と検索の結果を融合しているとの事。 その仕組みのヒントになる論文がこちら。 Toolformer: Language Models ... -
AI(ディープラーニング) how to
EGO4Dデータセットとは、人の日常の何かをしている自分視点のデータセット
【人が何かをしている時の自分視点が動画データセットEGO4D】 https://ego4d-data.org/ https://www.youtube.com/watch?v=xmzt9GCo8lE EGO4Dの説明動画 -
AI(ディープラーニング) how to
【Transformerの推論速度20倍】DataMUX: Data Multiplexing for Neural Networks★ディープラーニングのお気持ち
【DataMUXとは?】 Transformer系のモデル(例えばBERT等)の推論速度を向上させるアイディアの論文。具体的には、同時に入力できるバッチ数を20倍程度まで増やすことで、通常の1回の推論の時間やメモリリソースで、20回分程度の推論を行う事が出来るよう... -
文系AI講座
企画職向けAI論文解説:Data2Vec: 画像、言語、音声、全てに対応した表現学習フレームワーク:A General Framework for Self-supervised Learning in Speech, Vision and Language
【論文の基本情報】 META社(旧facebook)AI研究所の論文2022年1月発表元論文(https://ai.facebook.com/research/data2vec-a-general-framework-for-self-supervised-learning-in-speech-vision-and-language/) 【何が出来るの?】 画像、言語、音声など... -
文系AI講座
企画職向けAI論文解説:Transformerのモジュール構造化:TIM:Transformers with Competitive Ensembles of Independent Mechanisms
文系企画職の為のディープラーニングの論文解説です。DLの概要理解を通してAIのビジネス活用企画を立案する事を目的としておりDL専門家視点での細かな部分の説明は省略していたり、分かりやすく調整している場合があります。元論文はこちら(2021年2月の投... -
文系AI講座
企画職向けAI論文解説:文字指示による画像変換:StyleGAN-NADA: CLIP-Guided Domain Adaptation of Image Generators
文系企画職の為のディープラーニングの論文解説です。DLの概要理解を通してAIのビジネス活用企画を立案する事を目的としておりDL専門家視点での細かな部分の説明は省略していたり、分かりやすく調整している場合があります。元論文はこちら(2021年8月投稿... -
文系AI講座
企画職向けAI論文解説:ドメイン汎化:In Search of Lost Domain Generalization
企画職の為のディープラーニングの論文解説です。DLの概要理解を通してAIのビジネス活用企画を立案する事を目的としておりDL専門家視点での細かな部分の説明は省略していたり、分かりやすく調整している場合があります。元論文はこちら 要点:ディープラー... -
文系AI講座
企画職向けAI論文解説:Transformerを使った強化学習:Decision Transformer: Reinforcement Learning via Sequence Modeling
企画職の為のディープラーニングの論文解説です。DLの概要理解を通してAIのビジネス活用企画を立案する事を目的としておりDL専門家視点での細かな部分の説明は省略していたり、分かりやすく調整している場合があります。元論文はこちら 要点:強化学習の時... -
ディープラーニングプログラミング
BERTの日本語学習済みモデルの種類
【BERTモデル自体は自分で作る必要はない】 BERTモデルのプログラミング自体は、既にあるものを利用すればOKです。最も有名で確実なものは下記になります。 Googleがオフィシャルに公開しているもの(Tensorflow版のみ)https://github.com/google-researc...
12