Human Archive, startup założony przez absolwentów UC Berkeley i Stanfordu, zbiera w Indiach egocentryczne (pierwszoosobowe) nagrania wideo oraz dane z sensorów noszonych przez pracowników usług domowych, hoteli i restauracji. Firma twierdzi, że ma ponad 1 000 aktywnych zestawów nagrywających rozmieszczonych w różnych lokalizacjach i ogłosiła rundę finansowania o wartości 8,2 mln USD. Celem przedsięwzięcia jest dostarczenie robotyce i laboratoriom AI dużych, zsynchronizowanych zbiorów danych pokazujących ludzi wykonujących codzienne zadania.
Na czym polega model działania
Startup współpracuje z firmami z sektora usług domowych, hotelowego i gastronomicznego, proponując model, w którym pracownik pojawiający się u klienta nosi czapkę z kamerą lub inne urządzenia rejestrujące. Konsumentom zwykle proponowana jest obniżona cena usługi w zamian za zgodę na nagranie wizyty; alternatywnie można zamówić usługę bez rejestracji za pełną cenę. Zebrane dane mają służyć treningowi modeli fizycznej sztucznej inteligencji — tzn. systemów, które mają nauczyć się wykonywania zadań w świecie rzeczywistym.
Human Archive ogłosił rundę finansowania o wartości 8,2 mln USD z udziałem Wing Venture Capital, NVP Capital, Y Combinator oraz aniołów inwestycyjnych powiązanych z firmami takimi jak OpenAI, Nvidia, Google i Meta. Założycielami są absolwenci UC Berkeley i Stanfordu: Samay Maini, Rushil Agarwal, Shloke Patel i Raj Patel — ten ostatni pełni funkcję CEO. Wszyscy czterej mają doświadczenie badawcze w obszarach robotyki, sprzętu i danych dotykowych.
Sprzęt i rodzaje zbieranych danych
Human Archive rozwija i wykorzystuje różne urządzenia do rejestracji: czapki z kamerami, niewielkie kamery nadgarstkowe, rękawice sensoryczne rejestrujące siły dotyku, pełne kombinezony do motion capture oraz konfiguracje pozwalające na nagrywanie RGB-D (wideo zsynchronizowane z danymi głębi). Firma informuje o ponad 50 różnych rodzajach urządzeń w użyciu i o tym, że przeszła od prostych rozwiązań opartych na telefonach do własnych, zintegrowanych produktów hardware. Kluczowym elementem jest synchronizacja danych z wielu sensorów, co — według zespołu — zwiększa wartość zbioru dla laboratoriów badawczych.
Według przedstawicieli startupu sam obraz wideo jest niewystarczający: cenne są równoległe informacje o ruchu ciała, sile kontaktu i danych głębi, które umożliwiają lepsze odwzorowanie interakcji człowieka z obiektami w środowisku domowym czy przemysłowym.
Model biznesowy i kwestie wynagrodzeń
Human Archive płaci pracownikom podstawową stawkę w wysokości 1 USD za godzinę za uczestnictwo w zbieraniu egocentrycznych danych. Jednocześnie w mediach pojawiły się informacje, że inne firmy oferujące podobne programy płacą w Indiach więcej — według jednego raportu stawki mogą wynosić od około 250 do 400 rupii na godzinę. Firma argumentuje, że jej lokalna obecność i skala pozwalają na niższe koszty operacyjne i dostęp do większej liczby uczestników. Klienci końcowi są zachęcani niższą ceną usługi, jeśli wyrażą zgodę na nagranie wizyty.
- Zadania rejestrowane są z perspektywy pierwszej osoby (egocentrycznie).
- Human Archive deklaruje ponad 1 000 aktywnych headsetów i ponad 50 typów urządzeń.
- Startup zebrał 8,2 mln USD od inwestorów, m.in. Wing VC i Y Combinator.
- Pracownicy otrzymują bazową stawkę 1 USD/godz., istnieją jednak raporty o wyższych stawkach u konkurencji.
- Firma twierdzi, że dane są anonimizowane i twarze są rozmywane.
Kontrowersje, odmowy współpracy i kwestie prawne
Projekt spotkał się z odmowami współpracy ze strony niektórych dużych indyjskich platform usługowych. Niektóre rozmowy z potencjalnymi partnerami zakończyły się bez porozumienia, a temat publicznie nabrał rozgłosu, gdy media doniosły o negocjacjach i ich zakończeniu. Założyciele przyznali, że próbowali współpracować z kilkoma firmami, które ostatecznie zrezygnowały. Publiczne dyskusje objęły również wymianę zdań między przedstawicielami startupu a kierownictwem niektórych firm usługowych oraz doniesienia o obraźliwych komentarzach podczas prób nawiązania współpracy.
Wątpliwości budzi także obszar prywatności i mechanizmy wyrażania zgody. Human Archive deklaruje zgodność z indyjskim prawem o ochronie danych osobowych (DPDP Act), wskazując na polityki prywatności i mechanizmy informowania o celu przetwarzania. Firma zapewnia, że nagrania są anonimizowane i twarze rozmywane. Jednocześnie indyjskie Ministerstwo Elektroniki i Technologii Informacyjnych ma rzekomo przyjrzeć się praktykom firm zbierających egocentryczne dane przez pracowników usług domowych, co oznacza, że pytania regulacyjne mogą wpłynąć na skalowanie tego modelu.
Ekspansja i perspektywy wykorzystania danych
Poza działalnością w Indiach Human Archive rozpoczęło ekspansję do krajów Azji Południowo-Wschodniej oraz do Stanów Zjednoczonych, gdzie testuje programy pilotażowe oferujące usługi domowe w zamian za zgodę na rejestrację. Firma pracuje także nad platformą, która umożliwi szerszy udział w zbieraniu danych — celem jest pozwolić większej liczbie osób na zarabianie dzięki udziałowi w tworzeniu zbiorów treningowych dla AI.
Dla laboratoriów robotycznych i zespołów badawczych zyski z takich zbiorów danych polegają na dostępie do realnych, zsynchronizowanych modalności (wideo, głębia, siła, ruch ciała), których brakuje w wielu publicznych datasetach. Inwestorzy i badacze zainteresowani są testowaniem modeli na tego typu danych, co może przyspieszyć rozwój fizycznej AI, czyli systemów zdolnych do uczenia się wykonywania zadań w środowisku rzeczywistym.
Skalowalność przedsięwzięcia będzie zależała od kilku czynników: zdolności do zawierania i utrzymywania partnerstw z platformami usługowymi i klientami, zdolności technologicznej do zbierania i synchronizowania unikalnych rodzajów danych oraz od regulacji i społecznej akceptacji praktyk nagrywania w środowiskach prywatnych. Human Archive stara się zademonstrować wartość swoich danych przez trening wewnętrznych modeli i testy na robotach, co ma ułatwić pozyskiwanie odbiorców komercyjnych i badawczych.