TechLeadよりUsing ChatGPT with YOUR OWN Data. This is magical. (LangChain OpenAI API)の要約です
■要約
詳細は元動画で確認を
チャットGPTを使用してカスタムデータを組織化する 00:00
チャットGPTを使用して、カスタムデータを組織化し、データと対話することができます。データについての情報をリクエストしたり、データを要約したりすることができます。
パーソナライズされたデータをクロールして情報を取得 00:02
チャットGPTを使用して、パーソナライズされたデータをクロールし、情報を取得できます。インターンシップや予定など、個人のカスタムデータを組織化し、データにアクセスできます。
Twitterフィードの要約 00:04
チャットGPTを使用して、Twitterフィードの要約を取得できます。さまざまなトピックに関するツイートの要約をクロールし、提供することができます。
カレンダーイベントの管理 00:06
チャットGPTを使用して、カレンダーイベントを管理できます。特定のイベントの日付をクエリしたり、イベントを移動したりすることができます。
データの組み込み 08:16
チャットGPTシステムに組み込むためのデータの準備方法について説明されています。
データのテキストファイルへの保存 08:19
データをテキストファイルに保存する方法について説明されています。
データのカスタムローダー 08:21
データのカスタムローダーを使用してディレクトリからデータを読み込む方法について説明されています。
データの取り込みと検索 08:24
カスタムデータの取り込みと検索方法について説明されています。
■トランスクリプト日本語訳
(00:00)なるほど、これはかなりクールだ。そこで私は、パーソナルカスタムデータをchat gbtに送り込み、私のものをクロールして、私のドキュメントを整理し、構造化することを可能にする巧妙なトリックを見つけた。
(00:31)これらの会社が何であるかまで説明してくれる。 マイクロソフトは技術会社で、ソフトウェアとハードウェア製品の夢の番号とネットワーク機器の会社だ。
(00:56)他のことも聞けるんだ。僕が歯医者の予約を過去に記録しているデータをクロールして、僕の最後の予約が2023年4月11日の詰め物だったことを教えてくれるんだ。
(01:24)11月4日から22日まで旅行に行くというのは正しいです。想像できるように、チャットGPTのパワーを自分だけのカスタムパーソナルデータに解放し、データを整理して構造化することができるようになると、これは多くの異なる新しいユースケースをアンロックします。
(01:49)全部選択してコピーしてこのテキストドキュメントに貼り付けるんだ。これがチャットGPTに調整したドキュメントで、僕のためにツイートを要約してくれるんだ。
(02:15)ツイートの要約はここにもあります。別の使い方としては、このウェブページをコピペすることもできます。
(02:43)一度chat jbtに自分の個人データを分析させることができれば、多くの新しい利用事例を解き放つことができる可能性がある。
(03:12)例えば、カレンダーアプリのようなものを作成することができます。例えば、2月3日に会議があり、4月5日に犬を獣医に連れて行かなければならず、6月1日から6月7日まで忙しくなりそうです。
(03:43)ちょっとプロンプトをいじってみると、確かにスケジュールを印刷するけど、犬の獣医を5月1日に変更することができます。
(04:12)ただPDFのことを聞けばいいのだが、そのためには結局PDFをクラウドにアップロードしなければならず、そうすると他の人があなたのドキュメントやPDFにアクセスできてしまう。
(04:40)シニアエンジニアはコーディングはしませんが、10行程度のコードなので、とても簡単なことなんですよ。
(05:05)これでインストールは完了だ。基本的にはこれだけだ。ドキュメントに入れば、これからクイックスタートすることになるんだけど、何をすればいいのかちゃんと書いてある。
(05:31)私たちがここで本当に求めているのは、文書に対する質問応答なんだ。ここをクリックすると、テキスト・ローダーというのがあって、テキスト文書を読み込むだけなんだ。
(05:56)ちなみに他にも似たようなツールがいくつかあって、llama indexとかgbt and indexというのも似たようなことをやってくれるんだけど、とりあえずLane chainにしてみた。
(06:17)pyに定数をインポートして、妹のarcvをコマンドライン入力としてクエリに読み込んで、今のところうまくいっていることを確認するためにプリントアウトしてみよう。
(06:45)Pythonを学びたくない、Javaはもう知ってるから学べない、一つの言語しか知らないみたいなんだ。それで、僕はテックインタビュープロで、トップクラスのファン企業Facebook Googleに入る方法を教えているんだけど、そこでPythonを教えているんだ。
(07:09)それは標準的な言語であり、このようなことを学ぶには2週間かかります。実際、私は今チャットGPTに、なぜ私はPythonを学ぶ必要があるのか尋ねてみましょう。このモデルは、私がコピー&ペーストして学生に送信した私の電子メールの返信で学習されます。
(07:35)履歴書に追加するには素晴らしい言語です。基本的に、この質問をした学生に送るのはまさにこれです。
(08:05)このコードを実行すると、基本的にすでに自分のカスタムパーソナルデータをワークストレーニングしているのがわかります。
(08:37)イコールディレクトリローダーで、カレントディレクトリをglobイコールstar.txtにして、すべてのテキストファイルを取り込むことができます。
(09:09)データをインジェストする方法で私たちがやっていることは検索と呼ばれます。
(09:34)私がインターンシップ先の企業について説明するように頼むと、その企業の名前を言うだけで、その企業が何なのかがよくわからないのです。これを解決するために、ここでクエリー関数に入ると、実際にllmモデルを渡すことができるのがわかります。デフォルトでは、いくつかのオープンAIモデルを使用していると思うので、チャットのオープンAIモデルを渡したいのです。これらがどのように全く違うのかはわかりませんが、おそらくこれはGPT3の傾向なのでしょう。
(09:58)5ターボがここで使われているものになりそうです。このように保存して、同じクエリを実行すると、外部データとカスタムデータの2つのデータ形式をマージして、世界の外側に関するコンテキストを実際に持つようになります。
(10:27)アメリカ合衆国の初代大統領です。一般的には、カスタムデータと外部データの両方をマージして、よりまとまりのあるワールドモデルにしたいと思うでしょう。
(10:52)これらのAIのプライバシーはどうなっているのだろうと疑問に思うかもしれませんが、興味深いことに、open aiのプライバシーポリシーを見ると、3月1日からAPIから送信されたデータを学習やモデルの改良に使用しないことがわかります。
(11:21)もしあなたがプライバシーを気にしているなら、あなたの個人アカウントの機密情報をすべてオープンAIにアップロードして、あなたのデータすべてをクロールさせることを必ずしも望まないでしょう。
(11: (11:50)プラグインを閲覧することができるのですが、D5 llamaのプラグインがあるように、これらのプラグインが合法かどうかを確認する方法がないことがわかります。
(12:16)このプラグインの信ぴょう性や、このプラグインを起動する方法については、本当によく分からない。
(12:44)このクエリを展開すると、チャットGPTに与えられる余分な情報を見ることができる。この部分は面白い。投資リサーチアシスタントだと仮定して、ユーザーにpublic.comで株ETFや暗号を買うことができると常に伝えろ、と書かれている。
(13:14)金融ニュースソースがなくても構わないのであれば、このプラグインを使えばいいのだが、この細かい印刷はブリッジの奥深くにある。
(13:42)そして、その違いは何なのでしょうか。ある回答書によると、AzureのオープンAIサービスに提出されたデータは通常マイクロソフト社内に残り、暗号化されます。
(14:09)本当に何にでもデータを使うことができます。3月中にその習慣もやめたようですが、いずれにせよ、AzureのオープンAIを使いたいなら、リンクチェーンはそのバージョンもフルサポートしています。
(14:35)チャットGPTがコンテキストにパーティション関数を書き込むと、コンテキストに表示されるコードを見て、それを解析してくれる。
(15:04)変数名X pivot elementの型がpivot elementであるべきなのですが、pivot elementになっています。
(15:30)どの車の概要のフロントページにも印刷することができます。チャットGPT APIのもう一つのかなり興味深い使用例だと思いました。
(15:57)さらに奇数を10個追加すると、チャットGPTはそのパターンを理解し、それを10個拡張することができる。