ML w AWS – Sagemaker Autopilot

Wartość tej funkcjonalności AWS określa jako “Automatycznie twórz modele uczenia maszynowego z pełną widocznością”. W praktyce oznacza to, że po wskazaniu źródła danych treningowych, Sagemaker w naszym imieniu stworzy kilkanascie wariancji uwzględniejacych inżynierię cech jak, wybór algorytmu jako i samo trenowanie, a następnie stworzy tablice wyników pokazujących efekt (metrykę trenowania) każdego przebiegu.

Etapy definiowania i działania Sagemaker Autopiot.
Tablica wyników eksperymentów które wygenerował Sagemaker Autoplot. Każdy z nich może być podejrzany jako Jupyter Notebook.

Możemy łatwo wdrożyć wybrany model, co oznacza uruchomienie serwera, za który płacimy za każdą godzinę jego pracy. Następnie możemy wysyłać zapytania sieciowe do tego serwera, aby otrzymywać predykcje na podstawie przekazanych danych. Omówienie procesu wdrożenia wykracza jednak poza zakres tego artykułu.

Korzyści z wygenerowanego Jupyter Notebooka

Największą zaletą jest to, że możemy podejrzeć każdy z eksperyemtnóch w postaci wygenerowanego Jupyter Notebooka. Będzie on zawierał zawiera cały kod, niezbędny do wykonania poszczególnych etapów. Między innymi: instrukcje dotyczące inżynierii cech, zapisywania danych w S3, pobierania odpowiednich uprawnień z IAM, uruchamiania procesu uczenia i prezentacji wyników. Proces uczenia jest realizowany za pomocą interfejsu Estimator, który jest kluczowym elementem usługi Sagemaker.

Wygenerowany Jupyter Notebook jest bardzo pomocny jako punkt wyjścia. Kod, który zostaje wygenerowany, stanowi solidną podstawę i oszczędza czas, który inaczej musielibyśmy poświęcić na zgłębianie dokumentacji dotyczącej przesyłania danych do S3 lub obliczania macierzy pomyłek.

Jest to również szybka metoda oceny danych, która może odpowiedzieć na pytanie: „Czy te dane mają potencjał do przewidywania?”. Oczywiście podstawowym warunkiem jest odpowiednie podzielenie danych na zestawy treningowe i testowe.

Udostępnij ten wpis


Dobrnąłeś do końca. Jeśli ten artykuł był dla Ciebie wartościowy i chcesz otrzymywać informacje o kolejnych, to zapraszam Cię do zapisania się do listy mailingowej. Gwarantuję zero spamu.

Radek.

Inne artykuły

ML w AWS – Sagemaker Studio – IDE w przeglądarce

Sagemaker Studio – interaktywne środowisko dla Data Scientist. Z Jupyter Notebooks na pokładzie, oferuje współpracę, śledzenie eksperymentów i integrację z systemem kontroli wersji. Przegląd quasi …

ML w AWS – wstęp do usługi Sagemaker

Sagemaker: Wytwarzanie usług ML w chmurze AWS na nowym poziomie Odkryj potężną usługę Sagemaker, która gromadzi wszystkie niezbędne funkcjonalności związane z wytwarzaniem usług uczenia maszynowego w …

Rozwijasz czy produkujesz oprogramowanie?

Opracowywanie przepisów to proces uczenia się metodą prób i błędów. Nie oczekujesz, że pierwsza próba nowego dania wykonana przez szefa kuchni będzie ostatnią. W rzeczywistości …

Lean software development – eliminacja strat

Dowiedz się, jak wyeliminować marnotrawstwo i przyjąć zasady szczupłego rozwoju oprogramowania, aby dostarczyć więcej wartości swoim klientom przy mniejszym nakładzie pracy.

CD4ML: Continuous delivery for machine learning

Zacznijmy od początku: czym jest ciągłe dostarczanie (continuous delivery)? To podejście w wytwarzaniu oprogramowania, w którym wdrożenie nowej wersji jest decyzją biznesową. Ale jak to …