人間の振る舞いと同じようなふるまいをするAI J-Moshi(名古屋大学 大学院情報学研究科)デモを聞くとかなり人間がしゃべっているように聞こえるます。非商用利用ではソースも公開されているようです、ぜひお試しを。
参考:J-Moshi
人間の振る舞いと同じようなふるまいをするAI J-Moshi(名古屋大学 大学院情報学研究科)デモを聞くとかなり人間がしゃべっているように聞こえるます。非商用利用ではソースも公開されているようです、ぜひお試しを。
参考:J-Moshi
2025年2月14日 今年最初の9回のオンラインゼミやります!
寒い日々が続きますが、風邪などひかないよう気をつけましょう。最近のAI技術や社会の動向や気になるアニメなど、気軽にディスカッションしましょう!
日時: 2/14(金) 18:30〜21:00 (途中参加・退出OK)
テーマ React + Madoiで作るコラボツール
NEDO(https://www.nedo.go.jp/)のプロジェクト「GENIAC(Generative AI Accelerator Challenge)(https://www.meti.go.jp/policy/mono_info_service/geniac/index.html)」の成果をもとに作成されたとのことで商用利用可能で無償公開している。
ただし、今のところサンプル以外の日本語を入れてみたが期待した結果が出なかった、どうやら許諾が得られている画像を原則使用というこのようだ、日本語に特化して速度が速いのが特徴。
MicrosoftのPhi-4 はMSのモデル大規模のモデルの技術を活かして少ないパワーで動くようなモデルとのこと、10~13GぐらいのGPUメモリでも稼働する。MACだと16Gぐらいあれば実行できる。小規模化も加速しそうだ。
参考:https://www.itmedia.co.jp/news/articles/2501/09/news106.html
:https://techcommunity.microsoft.com/blog/aiplatformblog/introducing-phi-4-microsoft%E2%80%99s-newest-small-language-model-specializing-in-comple/4357090
google が新しい画像生成ツールを発表したとのこと。直感的に画像と適すつを組み合わせて視覚化できるとのこと。ただ、残念なことに12月23日現在日本ではまだ使用できないようだ。
google が出したVEO2動画生成の精度が向上し破綻などは少なそうに見える、ただし、使うには今は順番待ちが必要。
11月30日、12月1日に トナミホールディングス株式会社様の後援で「物流×生成AIワークショップ」を開催しました。 となみホールディングス株式会社様には物流業界の現状をご説明いただき様々な解決策を検討するワークショップとなりました。
KCGI ホームページ:https://www.kcg.ac.jp/news/2024/12/49233/
(参考)https://note.com/kotaro_kinoshita/n/n70df91659afc
日本語に特化されたOCRが公開されました。
フリーのわりに精度がよさそう
12/6(金)、2024年度第8回のオンラインゼミやります!おそらく今年最後になるかと思います。急に寒くなりすっかり冬になりました。風邪などひかないよう気をつけて下さい。最近のAI技術や社会の動向や気になるアニメなど、気軽にディスカッションしましょう!
• 日時: 12/6(金) 18:30〜21:00 (途中参加・退出OK)
• テーマ
◦ 物流×生成AIワークショップ開催報告
適当にオンライン飲み会に移行します。参加できる人は各自飲み物や食べ物を準備してください。
テキストや画像、動画から動画を生成するオープンソース版も新しいものが出てきている、高精細化にも使えそう、