2026-02

スポンサーリンク
AIコーディング

Qwen3-VLによる動画解析

環境:Visual Studio Code, Claude Code(Sonnet 4.6)以前からやってみたかった視覚言語モデルによる動画の解析をやってみました。前日の試作を拡張したものになります。Qwen3-ASRを使って動画音声の文字...
AIコーディング

Qwen3-ASRを使って動画音声の文字起こしをする

環境:Visual Studio Code, Claude Code(Sonnet 4.6)英語学習の目的で日本語・英語の字幕を同時に並べる動画プレイヤーを作りたい、と思っていたことがありましたが、いつのまにかローカルLLMで出来るようにな...
音楽生成AI

Audio to Audioで自作曲をアレンジする

環境:SUNO v5中学生から高校生の頃MIDIで作曲に挑んでいた時期がありました。ちょっとした黒歴史なんですが、当時はひとつのゲームをすべて自分で作ってみたい、という気持ちが強くて、たまに妄想ゲームのBGMも作っていました。目標のレベルに...
AIコーディング

ComfyUIをバックエンドに使う画像・動画生成アプリをつくる

環境:Visual Studio Code1.108.2, Claude Code(Opus 4.6)前回と前々回はプロンプト生成を支援するアプリを作成しましたが、今回はそれらを統合するようなアプリをClaude Codeとつくりました。画...
AIコーディング

動画生成用のプロンプト支援アプリをつくる

環境:Visual Studio Code1.108.2, Claude Code前回と同様、ローカルLLMを使って動画向けのプロンプトを生成するアプリをつくりました。今回は対話をするのではなく、解答だけを返します。LLMを完全にツールとし...
LLM

Qwen3シリーズ

中国アリババのQwen系LLMの第3世代のQwen3のよく使うものの分類メモ。いろいろあってわかりにくい。テキストLLM(Qwen3)Qwen3Qwen3はアリババのオープンソース大規模言語モデル。用途に応じた複数のサイズが展開されている。...
スポンサーリンク