奈良先端科学技術大学院大学(NAIST)は10月24日、着衣を介護するロボットシステムを開発したことを発表した(画像1)。開発は、情報科学研究科数理情報学研究室の柴田智広准教授らによるもので、成果は10月26日からスロベニアで開催されるヒューマノイド研究に関する国際会議「11th IEEE-RAS International Conference on Humanoid Robots」で発表される。
着衣は、生活を送る上で必ず行われる当たり前ながらも重要な日常生活での1動作だ。しかし、上肢の可動域や運動能力が制限される高齢者や片麻痺患者にとっては容易ではないため、衣服の着衣介護は介護者の重要な仕事の1つとして、多くの介護テキストでもその方法が紹介されている。
そこでロボットによる着衣支援が考えられたわけだが、それには大きな課題があった。介護動作中に柔軟物体である衣服を、複雑な形状や摩擦を持ち、姿勢も絶えず変動する被介護者と接触しながら移動させるので、最適な動作をあらかじめ計算することが困難だったのである。
そこで考え出されたのが、人の持つ高度な制御能力と、ロボットの自律的学習能力を組み合わせることによって、その課題を解決するという方法だ。
ただし、着衣介護の動作を人間が実際にやってみせる(Teaching by Showing)ことは容易だが、前述の課題があるため、ロボットが人に教えられた動作をそっくりに真似たとしても、着衣介護に失敗する可能性は十分にある。
そこで研究グループは、ロボットが人に教えられた動作(画像2)を出発点として、強化学習という試行錯誤的な学習アルゴリズムを適用し、被介護者に適した動作をできるだけ少ない試行回数で獲得することができる双腕ロボットを開発した。
強化学習のためには、
- ロボットが着衣状態を認識し
- その状態によって表現される試行のよさを評価し
- 試行の評価値に従って腕の制御方法を改善
する必要がある。
なお、柔軟物体である衣服の形状は、一般的には高次元空間で表現されるが、それでは理論的に非現実的な学習時間が必要だ。そこで、今回の研究では2つの物体間の縮まりを状態を表現する空間表現(Topology coordinates)を用い、着衣状態をわずか3つの変数で表現した。
また、強化学習によって変化させる腕の制御パラメータ数も理論的に少なく押さえる必要があり、研究では人の最適軌道生成モデルとして知られる「躍度最小軌道制御法」を用いることにより、学習パラメータは各腕について1つに絞り込むことを実現した。
開発したロボットシステムは各7自由度を持つ双腕型で、衣服と被介護者の絡まり状態を認識するための「光学式モーションキャプチャシステム」を組み合わせて構成されている。実験では、柔らかいタイプのマネキンを被介護者に見立て、半袖のTシャツを衣服として用いた。
1試行の開始時の状態は、画像1に示したようにマネキンがTシャツに袖を通した状態である。学習実験は、人間がロボットに教示した時のマネキンの姿勢を少し変化させていった。その結果、わずか数回の試行により、着衣に成功するための腕の運動の軌道を学習することができたのである(画像3)。
これまで、生活の質の向上のためのロボティクスとして、外骨格ロボットによるパワーアシストやリハビリ補助などの研究が盛んに行われてきたが、それに比較すると介護作業を行うロボットの研究はまだ盛んとはいえない。研究グループでは、日常生活に必要な機能は非常に多い上に、介護従事者不足の問題が解消される見通しもないため、介護を代行したり補助したりするロボットのニーズは大きいと考えられるという。
研究グループでは、今回のロボットシステムを用いた実際の人間を被験者としての実験も開始しており、良好な結果を得つつあるとしている。また、今後は、衣服の素材、被介護者の姿勢や体格に応じた実験を多数行っていく予定だ。
実験サンプルが多数集まれば、新しい衣服や被介護者に際しても、教示や学習の負荷をさらに減らせる可能性がある。実験サンプルから統計学習をしておくことによって、新しい衣服や被験者の組み合わせに対して、どのような運動軌道がよいかをうまく予測できるようになると考えられているからだ。
また研究グループは、実際に今回のシステムを社会で役立てるには、低価格化、安全性、そして小型化が重要な課題となるとしている。少なくとも、モーションキャプチャシステムについては、マイクロソフトのゲーム機Xbox 360の周辺機器「Kinect」のような、コントローラを使わない体感型センサに置き換えられると期待しているとした。