Python と Vision API を使用してプログラムで画像からラベルを抽出するには、Google Cloud Vision API の強力な機能を活用できます。 Vision API は、画像からラベルを自動的に識別して抽出できるラベル検出を含む、包括的な画像分析機能のセットを提供します。
開始するには、Google Cloud プロジェクトを設定し、Vision API を有効にする必要があります。それが完了したら、次のコマンドを実行して必要な Python ライブラリをインストールできます。
python pip install google-cloud-vision
次に、Vision API にアクセスするにはアプリケーションを認証する必要があります。これを行うには、サービス アカウント キーを作成し、キー ファイルのパスを指すように `GOOGLE_APPLICATION_CREDENTIALS` 環境変数を設定します。これは、次のコードを使用して実行できます。
python import os from google.cloud import vision os.environ['GOOGLE_APPLICATION_CREDENTIALS'] = '/path/to/service_account_key.json'
Vision API を使用して、プログラムで画像からラベルを抽出できるようになりました。次のコード スニペットは、これを行う方法を示しています。
python def extract_labels(image_path): client = vision.ImageAnnotatorClient() with open(image_path, 'rb') as image_file: content = image_file.read() image = vision.Image(content=content) response = client.label_detection(image=image) labels = response.label_annotations extracted_labels = [label.description for label in labels] return extracted_labels
このコードでは、まず `google.cloud.vision` ライブラリから `ImageAnnotatorClient` クラスのインスタンスを作成します。次に、画像ファイルを読み取り、ファイルの内容から「Image」オブジェクトを作成し、それをラベル検出のために Vision API に送信します。 API 応答にはラベルの注釈のリストが含まれており、そこからラベルの説明を抽出します。
これで、分析したい画像ファイルへのパスを渡すことで、「extract_labels」関数を呼び出すことができます。画像から抽出されたラベルのリストを返します。
python image_path = '/path/to/image.jpg' labels = extract_labels(image_path) print(labels)
これにより、画像から抽出されたラベルが出力されます。
plaintext ['cat', 'animal', 'whiskers', 'small to medium-sized cats', 'mammal']
Vision API は、高度な機械学習モデルを使用して画像を分析し、オブジェクト、シーン、その他の視覚的特徴を識別します。幅広いラベルを正確に検出できるため、画像分類、コンテンツ管理、ビジュアル検索などのさまざまなアプリケーションにとって価値のあるツールになります。
Python と Vision API を使用してプログラムで画像からラベルを抽出するには、Google Cloud プロジェクトを設定し、Vision API を有効にし、必要な Python ライブラリをインストールし、アプリケーションを認証してから、Vision API を使用してラベル検出を実行する必要があります。画像。抽出されたラベルは、さらなる分析に使用したり、画像内容の理解を深めるために使用できます。
その他の最近の質問と回答 EITC/AI/GVAPI Google Vision API:
- Google Vision API は、画像ではなく動画内のピロー Python ライブラリを使用してオブジェクトの検出とラベル付けに適用できますか?
- 画像やビデオ内の動物の周囲にオブジェクトの境界線を描画し、これらの境界線に特定の動物の名前を付ける方法を実装するにはどうすればよいですか?
- Google Vision API のオブジェクト認識用に事前定義されたカテゴリにはどのようなものがありますか?
- Google Vision API は顔認識を有効にしますか?
- 「draw_vertices」関数を使用してオブジェクトの境界線を描画するときに、表示テキストを画像に追加するにはどうすればよいですか?
- 提供されたコードの「draw.line」メソッドのパラメーターは何ですか?また、それらは頂点値の間に線を描画するためにどのように使用されますか?
- Python でオブジェクトの境界線を描画するために枕ライブラリをどのように使用できますか?
- 提供されたコードの「draw_vertices」関数の目的は何ですか?
- Google Vision API は、画像内の形状やオブジェクトを理解するのにどのように役立ちますか?
- ユーザーは API によって推奨される視覚的に類似した画像をどのように探索できますか?
EITC/AI/GVAPI Google Vision API でその他の質問と回答を表示する
その他の質問と回答:
- フィールド: Artificial Intelligence
- プログラム: EITC/AI/GVAPI Google Vision API (認定プログラムに進む)
- レッスン: 画像のラベル付け (関連するレッスンに行く)
- トピック: ラベル検出 (関連トピックに移動)
- 試験の復習