banner

블로그

Nov 02, 2023

룸바는 화장실에서 여자를 녹화했습니다. 스크린샷은 어떻게 Facebook에 등장하게 되었나요?

로봇 청소기 회사들은 귀하의 이미지는 안전하다고 말하지만, 우리 장치의 데이터에 대한 광범위한 글로벌 공급망은 위험을 초래합니다.

2020년 가을, 베네수엘라의 공연 노동자들은 대화를 나누기 위해 모인 온라인 포럼에 일련의 이미지를 게시했습니다. 사진은 인터넷에서 공유하고 싶지 않은 일부 사진을 포함하여 낮은 각도에서 캡처한 평범하고 때로는 친밀한 가정 장면이었습니다.

특히 눈에 띄는 장면에서는 연보라색 티셔츠를 입은 젊은 여성이 반바지를 허벅지 중간까지 내린 채 변기에 앉아 있습니다.

해당 이미지는 사람이 촬영한 것이 아니고, 아이로봇의 룸바 J7 시리즈 로봇청소기 개발 버전으로 촬영한 것입니다. 그런 다음 인공 지능 훈련에 사용되는 오디오, 사진 및 비디오 데이터에 라벨을 지정하기 위해 전 세계 직원과 계약을 맺는 스타트업인 Scale AI로 보내졌습니다.

이는 인터넷에 연결된 장치가 정기적으로 캡처하여 클라우드로 다시 보내는 일종의 장면이었습니다. 하지만 일반적으로 더 엄격한 저장 및 액세스 제어가 적용됩니다. 그러나 올해 초 MIT Technology Review는 폐쇄된 소셜 미디어 그룹에 게시된 이러한 개인 사진의 스크린샷 15개를 획득했습니다.

사진의 종류와 감도가 다양합니다. 우리가 본 가장 친밀한 이미지는 화장실에 있는 젊은 여성이 등장하는 일련의 비디오 스틸이었습니다. 그녀의 얼굴은 선두 이미지에서는 가려져 있었지만 아래의 거친 두루마리 샷에서는 가려지지 않았습니다. 또 다른 이미지에서는 얼굴이 선명하게 보이는 8~9세로 보이는 소년이 복도 바닥에 배를 깔고 누워 있다. 그는 눈높이 바로 아래에서 자신을 기록하고 있는 물체를 즐거운 표정으로 응시할 때 삼각형 모양의 머리카락이 이마에 흘러내립니다.

다른 사진은 전 세계 가정의 방을 보여줍니다. 일부는 인간이, 다른 하나는 개가 차지하고 있습니다. 벽과 천장 높이에 위치한 가구, 장식, 물건은 직사각형 상자로 윤곽이 그려지고 'tv', 'plant_or_flower', 'ceiling light'와 같은 라벨이 함께 표시됩니다.

Amazon이 최근 계류 중인 거래를 통해 17억 달러에 인수한 세계 최대 로봇 청소기 공급업체인 iRobot은 이러한 이미지가 2020년 Roombas에서 캡처되었음을 확인했습니다. 모든 이미지는 "하드웨어 및 소프트웨어 수정이 가능한 특수 개발 로봇"에서 나온 것입니다. 아이로봇 소비자 제품 구매에는 존재하지도 않았고 존재하지도 않았다”고 회사는 성명을 통해 밝혔다. 교육 목적으로 비디오를 포함한 데이터 스트림을 회사에 다시 전송한다는 점을 인정하는 서면 계약에 서명한 "유급 수집가 및 직원"에게 제공되었습니다. 아이로봇(iRobot)에 따르면, 이 장치에는 "비디오 녹화 진행 중"이라고 적힌 밝은 녹색 스티커가 붙어 있었고, "어린이를 포함하여 로봇이 작동하는 모든 공간에서 민감하다고 생각되는 모든 것을 제거"하는 것은 유료 데이터 수집가의 몫이었습니다.

아이로봇의 데이터 수집 노력에 참여하셨나요? 우리는 당신의 의견을 듣고 싶습니다. 다음 주소로 문의해 주세요.[email protected].

즉, iRobot의 추정에 따르면 스트림에 사진이나 비디오가 나타나는 사람은 누구나 Roombas가 이를 모니터링하도록 동의했습니다. iRobot은 MIT Technology Review가 동의 계약을 보는 것을 거부했으며 유급 수집가나 직원이 약관에 대한 이해를 논의할 수 있도록 하지 않았습니다.

우리와 공유된 이미지는 iRobot 고객이 제공한 것이 아니지만, 소비자는 iPhone에서 세탁기에 이르는 장치에서 다양한 수준으로 데이터를 모니터링하는 데 정기적으로 동의합니다. 데이터를 많이 사용하는 인공 지능이 완전히 새로운 제품 및 서비스에 점점 더 통합되면서 지난 10년 동안 이러한 관행이 더욱 보편화되었습니다. 이 기술의 대부분은 음성, 얼굴, 집 및 기타 개인 정보를 포함한 대량의 데이터를 사용하여 패턴을 인식하도록 알고리즘을 훈련시키는 기술인 기계 학습을 기반으로 합니다. 가장 유용한 데이터 세트는 가장 현실적이므로 집과 같은 실제 환경에서 가져온 데이터가 특히 가치가 있습니다. 개인 정보 보호 정책에 명시된 바와 같이 회사가 소비자 정보를 전파하고 분석하는 방법에 대한 폭넓은 재량권을 부여하는 모호한 언어로 표시된 것처럼 우리는 제품을 사용하여 간단히 동의하는 경우가 많습니다.

공유하다