2024-06-11

Python + Rye + Gemini API でAIチャットを作る

ChatGPTだとかCopilotだとか、AIチャットというのでしょうか。最近ちょこちょこ使っています。

便利でありがたいのですけど、質問の一部だけが毎回異なるような定型的な質問が簡単にできると更に便利だなと思っています。

例えば「英単語のXXXとXXXの違いと使い分けを教えてください」という質問はXXXの部分を変えて何度もしていたりします。

そういうのはGhatGPTのAPIを使えばできるよ、という記事は何度も見かけたのですけど APIの利用料など気にせずに、できれば無料で行いたい…。何かないかなと探してみるとGoogleのGemini APIが通常の使用では制限を気にせず無料で使えそうでした。

ということでGemini APIを使ってまずは試しに単純なチャットを作ってみました。いくらか使い慣れているPythonで作ります。

Gemini APIの使い方に関しては以下を参考にしています。

ai.google.dev

Ryeのインストール

セットアップを簡単にするためPythonのパッケージマネージャーにはRyeを使います。

Ryeをインストールしていない場合は以下の「Installation Instructions」に従ってインストールします。

rye.astral.sh

プロジェクトの作成

プロジェクトを作成します。

$ rye init gemini-tutorial
$ cd gemini-tutorial
$ rye sync

パッケージのインストール

Gemini API 用の Python SDK が含まれる google-generativeai パッケージをインストールします。

$ rye add google-generativeai
$ rye sync

Pythonファイルの作成

gemini-tutorial/src/gemini_tutorial/main.py として以下の内容でPythonファイルを作成します。

import google.generativeai as genai
import os

GOOGLE_API_KEY = os.environ.get("GOOGLE_API_KEY")

if GOOGLE_API_KEY is None:
    print("環境変数 GOOGLE_API_KEY がセットされていません")
    exit()

genai.configure(api_key=GOOGLE_API_KEY)

model = genai.GenerativeModel("gemini-1.5-flash")

chat = model.start_chat(history=[])

print("メッセージを入力してください(「exit」で終了します)")
print("")

while True:
    print("あなた:")
    message = input()
    print("")
    if message == "exit":
        print("終了します")
        break
    response = chat.send_message(message)
    print("AI:")
    print(response.text)

APIキーの取得

以下のサイトの「APIキーを取得する」ボタンをクリックしてAPIの使用に必要なAPIキーを取得します。

ai.google.dev

取得したら以下のようにして「GOOGLE_API_KEY」という環境変数に取得したAPIキーをセットします。 ("XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX"の部分は取得したAPIキー) Pythonプログラムからこの環境変数を参照します。

$ export GOOGLE_API_KEY="XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX"

セキュリティを考えてこうしているだけでプログラムを公開しないというのであればPythonプログラム内で

GOOGLE_API_KEY = os.environ.get("GOOGLE_API_KEY")

の代わりに

GOOGLE_API_KEY = "XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX"

としても構いません。

プログラムの実行

$ rye run python src/gemini_tutorial/main.py

プログラムの実行結果

$ rye run python src/gemini_tutorial/main.py
メッセージを入力してください(「exit」で終了します)

あなた:
こんにちは！

AI:
こんにちは！ 何かご用でしょうか？

あなた:
あなたは誰ですか？100文字程度で教えてください。

AI:
私は、Googleによって訓練された、大規模言語モデルです。 私は、テキストを理解し、生成することが得意です。 質問に答えたり、物語を書いたり、コードを生成したりできます。

あなた:
exit

終了します

たったこれだけのコードでできてしまうなんて驚きです。

.env ファイルの作成

上記のようにAPIキーを環境変数にセットしているとターミナルを立ち上げるたびに環境変数にセットしなければなりません。それは面倒なのでプログラム実行時にファイルからAPIキーを読み込むようにしてみましょう。 gemini-tutorial/.env を以下の内容で作成します。("XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX"の部分は取得したAPIキー)

GOOGLE_API_KEY="XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX"

.gitignore ファイル編集

.envファイルにはAPIキーが書かれているわけですからここでもセキュリティを考えて.envファイルをリポジトリーの管理対象外としたいのであれば gemini-tutorial/.gitignore に以下を追記します。

# env
.env

pyproject.toml ファイルの編集

.envファイルから環境変数に値をセットしてプログラムの実行をするようなスクリプトを gemini-tutorial/pyproject.toml に定義します。 pyproject.tomlに以下を追記します。

[tool.rye.scripts]
run-main = { cmd = "python src/gemini_tutorial/main.py", env-file = ".env" }

スクリプトを使ってのプログラムの実行

そしてプログラムの実行を以下のコマンドで行うようにします。

$ rye run run-main

2024-03-13

Ubuntuでネットワークの不調の原因を探る

Ubuntuを快適に使っていたのですが近頃Webブラウジングで固まったり、Web会議で映像や音声が途切れたりといったネットワークの不調があって困っていました。

結果的にwifiの電波状況の問題で wifi ルーターを再起動してオートチャネルセレクトを強制的に行わせ動作中にも定期的にオートチャネルセレクトがなされるようにルーターの設定を変更して改善しました。 →2024/03/27追記: 改善したと思いきや時間帯などによってはdropが10%を超えるので、さらにバンドステアリング機能もオフにしたところ、今度こそ改善したっぽいです。不調になったら接続先のSSIDの切り替えで周波数が切り替えられるのでこちらのほうが良さそうです。

運悪く不調を感じはじめた時期がUbuntuのバージョンを変えたタイミングだったことや、 WindowsやAndroidだと不調を感じることがなかったことから、 Ubuntuの何かが原因だと思ってしまい解決まで遠回りをしてしまいました。

解決にあたっては以下の記事がとても役に立ちました。

gihyo.jp

ここで紹介されているwavemonを以下のコマンドでインストールして

$ sudo apt-get install wavemon

以下のコマンドで起動。

$ wavemon

起動しておいて、不調を感じたときに見てみるとStaticsのdropが10%を超えていました。普段でも数%以上。一方で、そういえば不調を感じないなと思った別の場所、つまり別のwifi環境で見てみるとdropは0.X%でした。このことからwifiの電波状況だと判断しました。

2024-02-23

Fire HD 10 タブレット(≒Androidタブレット)をPC風に使う(ソフトウェア編)

当初この記事を書こうと考えたときは以下の動画にあるような Linuxをインストールしてあれこれというのを紹介しようと思っていました。

【改造不要】Fireタブレットでデスクトップが使いたい！2/2 Termux編【Amazon Fire HD 10 Plus (2021)】 - YouTube

しかし実際にやってみて自分としてはAndroidへのLinuxのインストールは実用的ではないと感じました。それで結局、人に勧められると思ったPC風に使う方法としては以下の2つとなりました。

PCにリモートデスクトップ接続して使う
PC風にWebブラウザーを使う

それぞれについて説明します。

PCにリモートデスクトップ接続して使う

タイトルの通りです。接続先のPCはWindows, Mac, Linux どれでも。 Fire HD 10 タブレットにインストールするリモートデスクトップクライアントアプリとしては探した中では以下のいずれかが良さそうです。

Microsoft Remote Desktop for Android
aRDP
bVNC

使い方のポイントとしては設定で解像度を指定してやることです。 Fire HD 10 タブレットだと 1920x1200 が画面の解像度なのでこの縦横比になるように、かつ操作しやすい表示になるように、例えばこの75%とかの解像度を指定してやります。

Fire HD 10 タブレットの場合、Google Playがインストールされていないのでアプリがインストールしづらいですね…。 Google Play をインストールしたり、APKダウンロードサイトからダウンロードしてきたりもできそうではありますけどあまり紹介されていないやり方としては aRDP, bVNC についてはオープンソースなので、ソースコードからビルドしてAPKを作ってインストールするという手があります。

以下のサイトの Building に従って、あっさりビルドできました。

github.com

それから出先から接続するのであればPCに何らかの方法でインターネット経由で接続できるようにしなければなりません。 ngrokを使ったり、VPNを経由するのがいいと思います。

ngrok.com

VPN接続にはVPNクライアントが必要ですがOpen SSTP Clientなんかがおすすめです。こちらもオープンソースで、こちらについては自分でビルドせずともGitHubからAPKがダウンロード可能です。

github.com