Implement vggish #1061

yuki399 · 2023-03-02T19:32:59Z

kyakuno · 2023-03-23T03:53:10Z

モデルアップロード済み。
https://storage.googleapis.com/ailia-models/vggish/vggish.onnx

kyakuno · 2023-03-23T06:41:06Z

audio_processing/vggish/vggish.py

+    else:
+        wav_data = librosa.load(input_path, sr=SAMPLE_RATE)[0]
+
+    samples = wav_data / 32768.0  # Convert to [-1.0, +1.0]


librosaの段階で-1.0 - +1.0に正規化されているのを、さらに/32768.0で小さくしているように見えます。

kyakuno · 2023-03-23T06:41:43Z

audio_processing/vggish/vggish.py

+    savepath = get_savepath(args.savepath, input_path)
+    logger.info(f'saved at : {savepath}')
+
+    np.save(savepath, result)


torchで計算したfeatureをnumpyで保存しておいて、誤差をprintしていただければと思います。

kyakuno · 2024-03-04T09:01:29Z

@yuki399 こちらも対応検討、お願いします。

yuki399 · 2024-03-12T21:34:56Z

指摘に関して修正しました

# Conflicts: # README.md # scripts/download_all_models.sh

kyakuno · 2025-01-02T01:38:54Z

入力の時間方向がStatic Shapeで19に固定されているので、音声の長さが19でない場合にReshapeでエラーになる。

kyakuno · 2025-01-02T01:39:34Z

@yuki399 入力のバッチサイズをDynamicShapeでエクスポートして、音声の長さが異なる場合も処理可能にできますでしょうか？

kyakuno · 2025-01-02T01:40:27Z

また、--inputに複数のファイルを与えた場合に、それぞれのファイルでEmbeddingを計算し、ファイル同士の距離をprintできればと思います。

yuki added 2 commits March 3, 2023 04:31

Implement vggish

4908f67

fix script/download_all_models.sh and README

6341ce4

kyakuno added 2 commits March 23, 2023 15:33

Update required ailia version

62c9826

Fix ailia audio error

175178e

kyakuno reviewed Mar 23, 2023

View reviewed changes

kyakuno added the waiting_enhancement label Mar 23, 2023

Removal of normalization and addition of error display

fe7b9a0

kyakuno removed the waiting_enhancement label Jan 1, 2025

kyakuno added 3 commits January 2, 2025 10:25

Merge branch 'master' into vggish

271aad2

# Conflicts: # README.md # scripts/download_all_models.sh

Fix import

f5e0d75

Fix usage

2dcd8fe

kyakuno added the waiting_enhancement label Jan 2, 2025

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Implement vggish #1061

Implement vggish #1061

yuki399 commented Mar 2, 2023

kyakuno commented Mar 23, 2023

kyakuno Mar 23, 2023

kyakuno Mar 23, 2023

kyakuno commented Mar 4, 2024

yuki399 commented Mar 12, 2024

kyakuno commented Jan 2, 2025

kyakuno commented Jan 2, 2025

kyakuno commented Jan 2, 2025

Implement vggish #1061

Are you sure you want to change the base?

Implement vggish #1061

Conversation

yuki399 commented Mar 2, 2023

kyakuno commented Mar 23, 2023

kyakuno Mar 23, 2023

Choose a reason for hiding this comment

kyakuno Mar 23, 2023

Choose a reason for hiding this comment

kyakuno commented Mar 4, 2024

yuki399 commented Mar 12, 2024

kyakuno commented Jan 2, 2025

kyakuno commented Jan 2, 2025

kyakuno commented Jan 2, 2025