Gdy mamy do czynienia z zagrożeniem, nasz mózg wykorzystuje wszystkie swoje możliwości, aby ocenić sytuację. Czy to był huk z rury wydechowej samochodu czy wystrzał z broni palnej? Czy to był dźwięk wybijanego okna czy ktoś po prostu upuścił szklankę? Czy ten człowiek krzyczał w gniewie czy z radości? Dodanie kontekstu wizualnego może ułatwić dostrzeżenie różnicy, ale często mamy tylko chwilę, aby dokonać pełnej oceny.
W świecie zabezpieczeń technicznych kamery dostarczają informacji zwiększających trafność oceny zagrożenia. Wykorzystywane są narzędzia analityczne do inteligentnej obróbki danych zawartych w obrazie. Większość osób działających w branży zabezpieczeń technicznych miało już do czynienia z analizą treści obrazu. Służące do tego inteligentne aplikacje wychwytują i analizują niecodzienne sytuacje, które mogą okazać się niebezpieczne. Aplikacje umożliwiają ocenę liczebności tłumu, ustalenie kierunku ruchu pojazdów, informują nas o wtargnięciu intruzów do zakazanych stref etc.
Równie cenne są aplikacje służące do analizy akustycznej, które identyfikują różne dźwięki niezależnie od tego, w którą stronę skierowane są w danej chwili obiektywy kamer. Aplikacje te mogą informować personel zajmujący się ochroną o pojawieniu się dźwięków związanych z agresją słowną, rozbijaniem szyb lub strzelaniem z pistoletu.
Podstawy analizy dźwięku
Oprogramowanie do analizy dźwięków wykorzystuje zarówno amplitudowe, jak i widmowe zależności. Badany jest rozkład poszczególnych fragmentów widma akustycznego w funkcji czasu. Dźwięki w tle, takie jak dźwięki spokojnych rozmów, ruchu ulicznego, muzyki, są ignorowane. Aplikacje uruchamiają alarm, gdy odnotowują bardzo konkretny wzór akustyczny. Pomaga to zminimalizować ryzyko fałszywej oceny źródła dźwięku nawet w trudnych warunkach, np. na peronach kolejowych czy w korytarzach więziennych.
Aplikacje analizujące dźwięk nie zapisują go w sposób ciągły. Program działa w trybie buforowym. Rejestruje dźwięk słyszalny kilka sekund przed wykryciem potencjalnie niebezpiecznego zdarzenia, kończy nagranie kilka sekund po wydarzeniu. Dźwięk jest zapisywany w celu dostarczenia ewentualnych materiałów dowodowych.
Analiza akustyczna w urządzeniach krańcowych, takich jak kamery sieciowe, stacje bramowe, głośniki sieciowe, ma wiele zalet. Analiza dźwięku odbywa się w obrębie urządzenia krańcowego, co eliminuje konieczność transmisji sygnału akustycznego i stosowania centralnego serwera. Materiał wizyjny jest dołączany jedynie w momencie wykrycia dźwięku świadczącego o niebezpiecznym wydarzeniu, co umożliwia ograniczenie niezbędnej przestrzeni dyskowej w urządzeniu pamięciowym. Dzięki analizie dźwięku możliwa jest natychmiastowa reakcja personelu zajmującego się ochroną, gdyż wygenerowane ostrzeżenie zwraca uwagę na konkretne wydarzenie. Rozszerzenie funkcjonalności kamer przez zastosowanie dodatkowo analizy dźwięków z ich najbliższego otoczenia jest bardzo istotnym usprawnieniem systemu zabezpieczającego dany obszar.
Podejmowanie decyzji na podstawie dźwięków – to, co słyszysz, sugeruje, co masz zrobić
Dzięki nowoczesnym technikom uczenia się przez maszyny lub systemy (machine learning) potencjalna liczba skatalogowanych dźwięków w bibliotece analitycznej może być bardzo duża, ograniczona jedynie przez zdolność przetwarzania danych w procesorze kamery. W kontekście bezpieczeństwa do dźwięków najczęściej rozpoznawanych przez oprogramowanie analityczne należą te, które mają związek z agresją słowną, dźwięki alarmów samochodowych oraz odgłosy wystrzałów i tłuczenia szkła.
Wykrywanie niebezpiecznych sytuacji
Wykrywanie niebezpiecznych sytuacji polega na identyfikacji dźwięków towarzyszących agresji słownej, zanim dojdzie do napaści. Oprogramowanie analityczne wyszukuje wzorce dźwiękowe związane z gniewem lub strachem. Amerykańskie Towarzystwo Psychologiczne stwierdziło, że dziewięćdziesiąt procent wszystkich agresywnych incydentów jest poprzedzonych atakiem werbalnym na skutek gniewu. Jeśli oprogramowanie analityczne rozpoznaje dowolne z tych unikatowych sygnatur dźwiękowych, system automatycznie wyzwala alarm i przesyła materiał wizyjny do pokoju kontrolnego lub wybranego urządzenia mobilnego. Dzięki wczesnemu ostrzeganiu personel może szybko zainterweniować, zanim agresja z fazy werbalnej przeistoczy się w napaść fizyczną. Aplikacje uruchamiane w kamerach umożliwiają pracownikom ochrony śledzenie rozwoju wydarzeń i podjęcie odpowiednich działań zapobiegawczych.
Wykrywanie uruchomienia alarmu samochodowego
Detekcja uruchomienia alarmu samochodowego polega na wykryciu dźwięków zgodnych z określonym wzorcem skojarzonym z powszechnie stosowanymi systemami alarmowymi. System może wykryć dźwięk generowany w znacznej odległości od kamery, dzięki czemu aplikacja jest szczególnie przydatna w wielopoziomowych garażach i na parkingach. Wysyłając w czasie rzeczywistym powiadomienia z informacjami o lokalizacji źródła dźwięku, aplikacja analityczna pomaga pracownikom ochrony szybciej reagować na incydenty i zapobiegać kradzieży lub wandalizmowi.
Wykrywanie strzałów z broni palnej
Aplikacja rozpoznaje odgłosy wystrzałów z różnych rodzajów broni palnej –pistoletów, strzelb, karabinów i broni automatycznej – i natychmiast uruchamia alarm dla personelu zajmującego się ochroną który może odtwarzać dźwięk w celu weryfikacji jego źródła i korzystać z kamer w celu dalszej oceny zagrożenia.
Wykrywanie tłuczenia szkła
Aplikacja rozpoznaje odgłos tłuczonego szkła niezależnie od tego, jakie właściwości ma szklana tafla (laminowana, jednowarstwowa albo wielowarstwowa, hartowana albo zbrojona za pomocą drutów). Po wykryciu dźwięku oprogramowanie wysyła ostrzeżenie do pracowników ochrony w celu zbadania przez nich sytuacji. Dzięki tworzeniu danych analitycznych w kamerze można zaoszczędzić – nie trzeba instalować czujek zbicia szyby w każdym oknie.
Coraz szersze wykorzystanie technik wizyjnych oraz analizy dźwięków z otoczenia kamer umożliwia bardzo precyzyjną ocenę sytuacji na chronionym obszarze. Inteligentna analiza tego, co jest słyszalne i widzialne, pomaga szybko ocenić zagrożenia i podjąć odpowiednie działania zapobiegawcze.
Należy podkreślić, że akustyczne systemy analityczne wykrywają dźwięki zgodne z określonymi wzorcami, ale nie rozumieją wypowiadanych słów, co jest ważne z powodu ochrony danych osobowych.
Od deski kreślarskiej do realnych zastosowań. Dwie historie z życia wzięte
Czym innym są abstrakcyjne opowieści o możliwościach technicznych systemów zabezpieczających, a czym innym praktyczne zastosowania. Przyjrzyjmy się dwóm różnym przypadkom praktycznego powiązania aplikacji analizujących dźwięki z wizyjnymi systemami dozorowymi.
Bezpieczniejszy areszt w mieście Billerica
W mieście Billerica w stanie Massachusetts systemy analizujące dźwięk odgrywają dużą rolę w zachowaniu bezpieczeństwa aresztantów. Wydział policji zainstalował kamery firmy Axis Communications na suficie każdej z cel. Kamery mają funkcję analizy dźwięku i wykrywają głośne krzyki towarzyszące agresji werbalnej. Kiedy aplikacja analityczna wykrywa dźwięki zgodne z tym wzorcem akustycznym, do systemu AXIS Camera Station w policyjnym centrum dowodzenia, a także do telefonu komórkowego oficera dyżurnego wysyłany jest sygnał ostrzegawczy wraz z zaznaczeniem numeru celi oraz odpowiednim materiałem wizyjnym.
Zapytany o przydatność tej instalacji, porucznik Greg Katz, kierownik ds. techniki w oddziale policji w Billerica, zauważył: „Dobrą rzeczą w analizie dźwięku jest to, że umożliwia ona funkcjonariuszom działania wyprzedzające. Im wcześniej dowiedzą się, że coś się dzieje, tym szybciej będą mogli zareagować, zanim dojdzie do jakichkolwiek szkód”.
Porucznik Katz zauważył również, że masowe wykorzystanie rozwiązań sieciowych oznacza, że aplikacje analizujące dźwięk można łatwo zintegrować z innymi zabezpieczeniami technicznymi. Następnym krokiem policji było zainstalowanie głośnika sieciowego firmy Axis w centrum dyspozytorskim w celu słownego zgłaszania jakichkolwiek incydentów. Jeśli na przykład aplikacja analizująca dźwięk wykryje działania agresywne, wysłany zostanie ostrzegawczy komunikat, np. „niebezpieczny incydent w bloku numer dwa”.
Zapobieganie bójkom w zespole szkół w Rock Hill
Zarząd zespołu szkół w Rock Hill zdecydował się zainstalować akustyczny system wykrywania agresji, aby pomóc personelowi w ograniczaniu liczby kłótni i bójek uczniów. Aplikacja do analizy dźwięku została zainstalowana we wszystkich zainstalowanych już wcześniej kamerach Axis. Umożliwiło to generowanie alarmów w przypadku kłótni lub wywiązania się bójki między uczniami. „Specyfiką szkoły średniej jest to, że uczniowie mogą żartować i wygłupiać się przez jakiś czas, po czym jeden z nich zbyt mocno popycha innego i kłótnia jest gotowa” – wyjaśnia Kevin Wren, dyrektor do spraw zarządzania ryzykiem w szkołach w Rock Hill.
W przeszłości wychowawcy polegali na alarmach wywoływanych przez naciśnięcie przycisku alarmowego. Jednak to powodowało opóźnienie w udzieleniu pomocy co najmniej o dwie minuty. „Teraz aplikacja analizująca dźwięk automatycznie powiadamia wychowawców, którzy natychmiast podejmują interwencję” – powiedział Wren. „Dzięki temu nasz czas reakcji spada do kilku sekund zamiast kilku minut”.
Lokalizacja mikrofonów jest powiązana z lokalizacją kamer, dlatego wraz z dźwiękiem towarzyszącym incydentowi dostarczany jest obraz pozwalający ocenić, czy sytuacja jest naprawdę niebezpieczna.
Choć jest jeszcze za wcześnie na dogłębną ocenę przydatności tych systemów, Wren zachowuje optymizm. „Mamy 2300 dzieci w tym jednym liceum. Jeśli uda nam się zmniejszyć liczbę bójek o 10 procent, będzie to dla nas duża wygrana”.
Po co łączyć analizę dźwięku z analizą obrazu?
Początkowo kamery były jedynie urządzeniami służącymi do obserwacji terenu i nagrywania materiału wizyjnego. Przez lata moc obliczeniowa procesorów wizyjnych wzrastała, a kamery zyskiwały zdolność do wykonywania coraz bardziej skomplikowanych operacji. Obecnie aplikacje służące do analizy treści obrazów dają kamerom inteligencję, która pomaga pracownikom ochrony w interpretowaniu tego, co widzi kamera. Wyposażenie kamer w funkcję analizy dźwięku daje im uszy pozwalające usłyszeć i ocenić to, co jeszcze nie zostało zauważone na obrazie.
Axis Communications
Tłumaczenie: Andrzej Walczyk