💾上級
JSON 形式: 開発者向けの構造化データ
API 統合のためにセグメント、タイムスタンプ、メタデータ、スピーカー情報を含む完全な文字起こしデータを JSON としてエクスポートします。
4分で読了
TranscribeNext Team
更新日: 2025年1月15日
JSON 形式は、完全な文字起こしデータを構造化された JSON としてエクスポートします。統合構築、カスタムアプリ、データ分析パイプラインを行う開発者に最適です。
得られるもの
- 完全な文字起こしメタデータ
- 全文コンテンツ
- タイムスタンプ付きのセグメントデータ
- 言語検出情報
- 秒単位の長さ
- 作成日
- 一意の文字起こし ID
- 元のファイル名
JSON 構造
JSON エクスポートは次の構造に従います:
{
"id": "transcription_abc123",
"fileName": "meeting-2025-01-15.mp3",
"text": "Full transcription text...",
"language": "en",
"duration": 1825.45,
"createdAt": "2025-01-15T10:30:00.000Z",
"segments": [
{
"id": 1,
"start": 0.0,
"end": 5.23,
"text": "Hello everyone and welcome..."
},
{
"id": 2,
"start": 5.23,
"end": 9.45,
"text": "Thank you for having me..."
}
]
}フィールドの説明
- id - 一意の文字起こし識別子
- fileName - アップロードされた元のファイル名
- text - 単一の文字列としての完全な文字起こし
- language - 検出/選択された言語コード(en、es、fr など)
- duration - 秒単位の音声長(浮動小数点)
- createdAt - 作成の ISO 8601 タイムスタンプ
- segments - タイムテキストセグメントの配列
セグメントオブジェクト
segments 配列内の各セグメントには以下が含まれます:
- id - 連番のセグメント番号
- start - 秒単位の開始時刻(浮動小数点)
- end - 秒単位の終了時刻(浮動小数点)
- text - セグメントのテキストコンテンツ
主な活用シーン
- API 統合とウェブフック
- カスタムデータ処理パイプライン
- 分析とテキストマイニング
- カスタム字幕ジェネレーターの構築
- データベースインポート
- 機械学習の学習データ
- 検索インデックス作成
- カスタムレポート生成

プロのヒント
JSON エクスポートは可読性のために 2 スペースのインデントで整形されています。データを処理するには JavaScript で JSON.parse()、Python で json.loads() を使用してください。
JSON データの処理(JavaScript)
// Read and process JSON export
const data = JSON.parse(jsonString);
// Get total duration in minutes
const minutes = Math.floor(data.duration / 60);
// Extract all text
const fullText = data.text;
// Process segments
data.segments.forEach(segment => {
console.log(`[${segment.start}s] ${segment.text}`);
});
// Filter segments by time range
const firstMinute = data.segments.filter(
seg => seg.start < 60
);JSON データの処理(Python)
import json
# Load JSON file
with open('transcription.json', 'r') as f:
data = json.load(f)
# Access fields
print(f"File: {data['fileName']}")
print(f"Duration: {data['duration']}s")
print(f"Language: {data['language']}")
# Process segments
for segment in data['segments']:
print(f"[{segment['start']:.2f}s] {segment['text']}")重要
長い文字起こしでは JSON ファイルが大きくなる場合があります。1 時間の文字起こしは、セグメントの密度に応じて 100〜200KB の JSON ファイルになることがあります。
タグ
jsonapideveloperstructured-dataintegration