欠落している Midjourney API の使い方(および隠しコマンド言語)

Midjourney を使用して画像を作成したい場合は、Discord を使用する必要があります。
そうですね。
MidjourneyはAPIをリリースしていませんが、徐々にリリースに向けて歩みを進めています。社内向けのプライベートAPIは確かに存在しますが、外部のパブリックユーザーにとっては、この技術は完全にDiscordに紐付けられています。midjourney.comでの認証はDiscord経由で行われ、この技術とやり取りする唯一の方法は、Discordで/imagineコマンドを送信することです。
これにより、一部の論理的なワークフローが阻害されます。例えば、一連のプロンプトを作成し、それらをまとめて送信して夜間に実行したい場合や、各画像を自動的に拡大し、使用したプロンプトを記述したテキストファイル(またはデータベースエントリ)とともにディレクトリに保存したい場合などです。
念のため言っておきますが、Midjourneyはボリュームのある環境でこそ最も効果を発揮する技術です。確かに、いじってみれば、楽しいクリエイティブなヒントを入力するだけで素敵な画像が作れるでしょう。しかし、特定の種類の画像や見た目を実現したい場合は、反復的に生成と調整を行う必要があります。
例えば、典型的なワークフローをご紹介します。ルー・ゲーリック病を患い、フルタイムのマネージドケアを受けている友人がいます。彼に似た人の面白い画像を送って、彼の気分を明るくしようと思い立ちました。他の友人がコメントしたり、彼とチャットしたりできるのです。
これを実現するための手順は次のとおりです。
- 私の友人を表すフレーズを見つけてください。例えば、「親しみやすい顔と巨大な前腕を持つ中年のイタリア人男性」
- 「口ひげなし」を追加して年齢を微調整しないと、すべての画像がマリオとハルク・ホーガンが出会ったように見えてしまいます。
- 楽しいシーンを見つけましょう。例えば、「第二次世界大戦中のドイツの潜水艦で、巨大な前腕を持つ、とてもハンサムで気難しいイタリア人男性が、仲間の船員たちと自撮りをし、みんなが笑いながらビールを飲んでいる」などです。
- 照明、雰囲気、アート スタイル、その他多数のパラメーターを試してみてください。
- そして、手がおかしくなっている、または背景にいる誰かが片方の目やその他のAIアーティファクトを失っているすべての遺伝子を除去します。
つまり、50回生成すれば簡単に目的の結果が得られます。つまり、/relax はまさにそのためにあるのです。
残念ながら、これを実行するには、これらのコマンドをすべてDiscordに入力する必要があります。必要なバリエーションをすべて生成し、APIにパイプライン処理するPythonスクリプトはもう不要です。
まあ、完全に忘れる必要はありませんが…
Mediumで興味深いアプローチをしている素晴らしい記事を見つけました。PyAutoGUIを使って、Discordで会話し、テキストファイルからプロンプトを入力するボットを構築するというものです。実際に試してみたところ、宣伝通りの動作をしました。prompts.txtファイルを作成し、ボットがコマンドを入力する様子を観察するだけです。
ありきたりなDiscordボットを書いてもうまくいきません。Midjourneyボットは「/imagine」と「Tab」、そしてプロンプトの入力を期待しているからです。本当に面倒です。
残念ながら、これはイベントを待つ偽のGUIオペレータなので、データベースエントリを作成するための修正はまだ完了していません。理論的には、添付ファイルを取得して保存できるはずです。現在作業中です!
その間、以下のリソースが役に立つかもしれません:
- まず、一般的なアドバイスとして、自分のDiscordサーバーを作成し、そこにMidjourneyボットを追加してください。公式サーバーを使用すると、結果が他の人のものと混ざってしまい、見栄えが悪くなります。
- 主要なスタイルとコマンド:このGithubは素晴らしいリソースです。照明、スタイル、ムード、アーティスト、パースペクティブなど、数多くのコマンドが揃っています。
- 主要なGithubコマンドの簡単な概要
- すべてのアーティストとスタイルを表示する、 驚異の 50 TB の Google スプレッドシート(実際には 50 TB ではありませんが、巨大です)