Googleの人工知能チーム、8×8のジャギーな低解像度を高解像度に補完する技術を公表
モザイク方面での応用方法も?
Googleの人工知能研究チーム「Google Brain」が、低解像度の画像から高解像度の画像を生成する技術「Pixel Recursive Super Resolution」を発表しました。8×8ドットに圧縮された画像から、よりくっきりと細部が描きこまれた元の画像の予想図が成果として公開されています。
低解像度でジャギーな画像を高品質な見かけの画像にアップグレードする超解像技術はディープラーニング(機械学習)の応用分野として定着しており、それ自体に新規性はありません。Googleもリアルタイムで高解像度化する新技術RAISR(Rapid and Accurate Image Super-Resolution)を公開済みで、写真をきれいに拡大するサービスもGoogle以外ですでにスタートしています。
この新技術の画期的な点は、画像の「補完」というよりは「復元」の域に達したところです。8×8ドットとモザイク並みにジャギーに圧縮された画像から、「元々はこうだったであろう」画像を推測して出力。32×32に高解像度化された画像と圧縮前のソース画像が並べられていますが、目元など細かい印象の違いはあるものの、おおむね同一人物と言って良さそうな復元ぶりです。
この技術は、二つのニューラルネットワーク技術の合わせ技です。一つは他の高解像度画像を8×8に圧縮したデータ群とマッチングする「Conditioning network」で、もう一つは画像の詳細を描き込んでいく「PixelCNN」。前者でドットと色からパターンを判別し、後者で解像度に足りない描き込みを補完する。たとえば眉だと識別されれば、茶色の画素で隙間を満たしていくという段取りです。
監視カメラの不鮮明な画像をクリアにして容疑者特定の参考にする、一昔前の低解像度なWebサイトの写真を高解像度化して再掲載したりと様々な応用が考えられますが、「モザイクのようにジャギーな画像を復元する」という方向で、実用化の暁には特殊なニーズが盛り上がるかもしれません。
私の意見
全てを再現することは不可能であるが、再現する物の種別が限定できれば、ある程度は可能であろう。
人間、男性、日本人など出来るだけ特定していけば、再現精度は高くなるだろう。
人間の脳も特徴を捉えて特定の人を記憶している。日本人であれば、日本人の特徴のデータを多く記憶しているので、日本人は判別しやすいが、西洋人だと記憶データが少ないので、判別が難しくなる。
洋画を見ると名前が覚えられないので苦労する。