GoogleのImageFxとRunway Gen3を組み合わせてみました。どちらもGoogleアカウントがあれば無料で使えます。背景のぼかしとかうまく使えたり、人物破綻が少なくなったり精度は上がっているようです。
投稿者: じん
【トピックス】画像生成で使われる PythonのライブラリのFLUX.1 がかなり機能が高い。
参考:https://pc.watch.impress.co.jp/docs/column/nishikawa/1616924.html
Stable Diffusion からのスピンアウト。
やってみた、かなりリアルな生成ができた(看板の文字もきれい)
動画の生成も(短ければ)できる、動画は短いものしかできず、質はいまいちだった。
とはいえ、このライブラリがいろいろなものを吸収して成長している状態のようだ。
[8/9(金)18:30‐]未来環境ラボゼミ
(8/9)、2024年度第5回のオンラインゼミやります!春学期お疲れ様でした。夏本番に入り、蒸し暑い日が続きますが、体調に気をつけつつ頑張りましょう。紹介したいことやディスカッションしたいことがあれば、是非エントリーしてください!
- 日時: 8/9(金) 18:30〜21:00 (途中参加・退出OK)
- テーマ
- 最新物体認識技術の動向(中口)
- 会場
- Presence (Chrome推奨。ビデオ→マイクの順でonにしてください)
- https://fungo.kcg.edu/presence/futurelab-semi-2394hsk/
- Zoom(予備):
- https://zoom.us/j/9971962049?pwd=cU1aeXJ5YThma09xRWR6enB3WXE4UT09
- 適当にオンライン飲み会に移行します。参加できる人は各自飲み物や食べ物を準備してください。
[7/19(金)18:30‐]未来環境ラボゼミ
(7/19)、2024年度第4回のオンラインゼミやります!梅雨も開けていないのに気温が高い日もあり、体調管理が難しい日々が続いていますね。春学期もあと少し、体調に気をつけつつ頑張りましょう。紹介したいことやディスカッションしたいことがあれば、是非エントリーしてください!
- 日時: 7/19(金) 18:30〜21:00 (途中参加・退出OK)
- テーマ
- MusePoseで遊ぼう(きょこたんを踊らせてみる)(中口)
- 会場
- Presence (Chrome推奨。ビデオ→マイクの順でonにしてください)
- https://fungo.kcg.edu/presence/futurelab-semi-2394hsk/
- Zoom(予備):
- https://zoom.us/j/9971962049?pwd=cU1aeXJ5YThma09xRWR6enB3WXE4UT09
- 適当にオンライン飲み会に移行します。参加できる人は各自飲み物や食べ物を準備してください。
【トピックス】IoA(Internet of Animals)が広まってるらしい
動物にセンサーを付けて活用するIoTの事例が出てきているらしい
参考:https://ideasforgood.jp/glossary/internet-of-animals/
https://www.jst.go.jp/kisoken/crest/research/activity/1111094/ai_sympo3/pdf/crestai_12.pdf
【トピックス】富岳で学習した Fugaku-LLM
フォーマットは標準的なもの、日本語の性能では最高とのこと。
実際にやってみたがすこし変な情報がある、呼び方にコツがあるのかもしれない。
【トピックス】松尾健からスピンアウトのELYZA
公開はされてないがメタのモデルをチューニングしたものが日本語性能でGPT4より上回ったっとのこと。
80億パラメータモデルは公開しているので、実際にやってみたが 意図通り自然な回答があった。
【トピックス】Lumaが公開したDeepDreamを試してみた
テキストから動画を作ってみた、結構クオリティが高い。静止画から動画を作ることもできるようだが、破綻することもあり、繰り返してよさげなところを探る必要はありそう。
動画:
【トピックス】高校生が作ったAIモデルが日本語能力最強ということだ、
既存のモデルを合成して作ったとのこと、
小さめのGPUでも日本語モデルがそこそこ成績が良い、やってみたら結構流暢Mistral系をカスタマイズしたようなものをチューニングしたらしい
参考:15歳の高校生、「日本語能力最強」のAIモデル開発 AITuber向けに設計(アスキー) - Yahoo!ニュース
【トピックス】チャットAI「Grok」、Xの有料ユーザーに開放
イーロンマスク率いるxAIが開発したLLM「Grok」がXの有料ユーザに試験的に解放されたとのこと、
https://www.itmedia.co.jp/news/articles/2405/08/news174.html
https://note.com/doerstokyo_kb/n/n890fd4ad7e1e