mixne

PCガジェットを中心とした、しおんが思ったこと、感じたことを書いています。

Stable Diffusionってスマホで動くらしい

先日のBackspace.fm #525を聞いて、久しぶりにStable Diffusion使おうと思いました。でも、Google ColabではWeb UI使えなくなってるし、NVIDIAGPUを積んだPCもない。そこで思ったのが、iPhoneで動くんじゃない?ということ。

調べてみるとDraw Thingsというアプリがあるようです。言われてみると、Apple Newsラジオ ワンボタンの声あたりで紹介されてた気がします。出た当時はA11 Bionic(iPhone 8)を使っていたので違う世界の話だと思って聞き流していました。

実際にインストールしてみると、クラッシュの連続。iPhone 13で動かないならPro系でしか動かせないじゃんと思いつつ、タスクキルと再起動をしたところ動きました。Anything v3しか試していませんが、生成にかかる時間も数分程度。思ったよりも実用的です。

生成されたイラストは趣味嗜好を反映したもので恥ずかしいから乗せませんが、結構楽しい。

惜しむらくは手元で生成できるにしても電源の関係上、外では使いにくいところ。GPU(というか、TPU?)が全力で動いているので、いくらApple Siliconといえどもバッテリー消費は激しいです。

ゲームをしない私にしてみれば2世代前のA13 Bionicですら宝の持ち腐れ状態でしたが、改めてiPhoneの性能の良さを再認識させられました。ぼちぼち遊んでいこうと思います。

CryptCloudViwerでiPhoneから暗号化済みファイルを簡単に閲覧

iOSからRclone Cryptでアップしたファイルを閲覧できればいいのにと思って、改めて調べたらこのアプリに行きつきました。

調べてみると日本の方が作られているとのこと。最終更新が3年前で止まっているのは気になりますが、Rclone以外にもCarotDAVやCryptomatorに対応しているとのことで便利そうです。

初見では設定に苦労しましたが、一度設定してしまえばあとは安定して動作しています。具体的に苦労した点はrclone.confという設定ファイルを読み込むことで簡単に設定できるようになっているのですが、読み込めないというもの。おそらくiOSの仕様だと思うのですが、iCloud DriveやLocalあたりに置いておかないとファイルを読めないそうです。

lithium03.info

github.com

やっぱり、編集ってむずかしい

先週の火曜日からずっと一つの音声の編集をしてた。スポンサー回だから詳細は言えないけど、3人分の音声の編集。

最初の方は力業でクリップの分割と位置合わせを繰り返す。最終的に1時間半の音声が60クリップほどに分割することになってびっくりだけど、なんとか終了。10時間ぐらいかかったんじゃないかな。

ところが、分割を繰り返し行ったがゆえに映像が使えなくなってしまった。YouTubeでのプレミア放送にはバックアップを使うことにしたのだけど、当然音量がそろっていない。

ダイアログレベラーでそろえてくれとのこと。作業に取り掛かると、クリップ単位とトラック単位の2種類あって、2重でかけられるらしい。実際やってみると、効果はあってどうすれば良いのかいまいちわからなくなった。

そこでググってみるもいまいちわからない。

っと、ここまでは前置き。今まで半年間音声編集をやってきたわけだけど、実際のところは何もわかっていなかったのだと感じた。ちゃんと勉強しなきゃいけないと思いつつ、聞いても違いが判らないのでどうしようもない。音割れもよっぽどひどくならないとわからないし、どうしようか。

KanaruさんやWakaさんは凄いなと。もちろん生きた期間が違うのだから当然ではあるのかもしれないけど、ふとそんなことを思う。自分にはないものをたくさん持っている。


それにしても、寒いですね。Google Homeに室温を聞いてみると、19℃とのこと。

先週までは10月なみの気温だったのに、いきなり寒くなって本当に良くない。体調は崩れないけど、足は冷たくなるし先週までのちょうどよい気温を返してほしい。

また文章書くの下手になったかな?最近小説読めてないもんね。色々やりたいことが多すぎる。