JSON 形式: 開発者向けの構造化データ

API 統合のためにセグメント、タイムスタンプ、メタデータ、スピーカー情報を含む完全な文字起こしデータを JSON としてエクスポートします。

4分で読了 TranscribeNext Team 更新日: 2025年1月15日

JSON 形式は、完全な文字起こしデータを構造化された JSON としてエクスポートします。統合構築、カスタムアプリ、データ分析パイプラインを行う開発者に最適です。

得られるもの

完全な文字起こしメタデータ
全文コンテンツ
タイムスタンプ付きのセグメントデータ
言語検出情報
秒単位の長さ
作成日
一意の文字起こし ID
元のファイル名

JSON 構造

JSON エクスポートは次の構造に従います:

{
  "id": "transcription_abc123",
  "fileName": "meeting-2025-01-15.mp3",
  "text": "Full transcription text...",
  "language": "en",
  "duration": 1825.45,
  "createdAt": "2025-01-15T10:30:00.000Z",
  "segments": [
    {
      "id": 1,
      "start": 0.0,
      "end": 5.23,
      "text": "Hello everyone and welcome..."
    },
    {
      "id": 2,
      "start": 5.23,
      "end": 9.45,
      "text": "Thank you for having me..."
    }
  ]
}

フィールドの説明

id - 一意の文字起こし識別子
fileName - アップロードされた元のファイル名
text - 単一の文字列としての完全な文字起こし
language - 検出/選択された言語コード(en、es、fr など)
duration - 秒単位の音声長(浮動小数点)
createdAt - 作成の ISO 8601 タイムスタンプ
segments - タイムテキストセグメントの配列

セグメントオブジェクト

segments 配列内の各セグメントには以下が含まれます:

id - 連番のセグメント番号
start - 秒単位の開始時刻(浮動小数点)
end - 秒単位の終了時刻(浮動小数点)
text - セグメントのテキストコンテンツ

主な活用シーン

API 統合とウェブフック
カスタムデータ処理パイプライン
分析とテキストマイニング
カスタム字幕ジェネレーターの構築
データベースインポート
機械学習の学習データ
検索インデックス作成
カスタムレポート生成

プロのヒント

JSON エクスポートは可読性のために 2 スペースのインデントで整形されています。データを処理するには JavaScript で JSON.parse()、Python で json.loads() を使用してください。

JSON データの処理(JavaScript)

// Read and process JSON export
const data = JSON.parse(jsonString);

// Get total duration in minutes
const minutes = Math.floor(data.duration / 60);

// Extract all text
const fullText = data.text;

// Process segments
data.segments.forEach(segment => {
  console.log(`[${segment.start}s] ${segment.text}`);
});

// Filter segments by time range
const firstMinute = data.segments.filter(
  seg => seg.start < 60
);

JSON データの処理(Python)

import json

# Load JSON file
with open('transcription.json', 'r') as f:
    data = json.load(f)

# Access fields
print(f"File: {data['fileName']}")
print(f"Duration: {data['duration']}s")
print(f"Language: {data['language']}")

# Process segments
for segment in data['segments']:
    print(f"[{segment['start']:.2f}s] {segment['text']}")

重要

長い文字起こしでは JSON ファイルが大きくなる場合があります。1 時間の文字起こしは、セグメントの密度に応じて 100〜200KB の JSON ファイルになることがあります。

エクスポートの概要: 適切な形式を選ぶ

利用可能なすべてのエクスポート形式と、それぞれの使い分けを説明します。

📄

TXT 形式: シンプルなプレーンテキスト

任意のテキストエディタやアプリと互換性のある、クリーンでシンプルなテキストファイルとして文字起こしをエクスポートします。

⏱️

タイムスタンプの活用

文字起こし内のタイムスタンプのしくみと効果的な使い方を理解します。

エクスポート・形式に戻るすべてのカテゴリ