Oracle udostępnia MySQL HeatWave ML – najłatwiejszy, najszybszy i najtańszy sposób na wykorzystanie możliwości uczenia maszynowego przez programistów.
Firma Oracle ogłosiła, że Oracle MySQL HeatWave obsługuje teraz modele uczenia maszynowego (ML) w bazie danych, oprócz dostępnego wcześniej przetwarzania transakcji i analizy – jest to jedyna usługa bazodanowa MySQL w chmurze, która to umożliwia. MySQL HeatWave ML w pełni automatyzuje cykl życia procesów ML i przechowuje wszystkie wytrenowane modele wewnątrz bazy danych MySQL, eliminując potrzebę przenoszenia danych lub modelu do osobnego narzędzia. Eliminacja procesów ETL zmniejsza złożoność aplikacji, obniża koszty i poprawia bezpieczeństwo zarówno danych, jak i modelu.
HeatWave ML jest dołączony do usługi chmury bazodanowej MySQL HeatWave we wszystkich 37 regionach Oracle Cloud Infrastructure (OCI).
Do tej pory dodanie możliwości uczenia maszynowego do aplikacji MySQL było dla wielu programistów zbyt trudne i czasochłonne. Po pierwsze, trzeba było wykonywać procesy ekstrakcji danych z bazy danych do innego systemu w celu utworzenia i wdrożenia modeli ML. Po drugie, istniejące usługi wymagają od programistów posiadania znacznej wiedzy w zakresie szkolenia modelu ML – w przeciwnym razie model nie jest optymalny, co pogarsza dokładność przewidywań. MySQL HeatWave ML rozwiązuje te problemy poprzez natywną integrację możliwości uczenia maszynowego wewnątrz bazy danych MySQL, eliminując potrzebę przenoszenia danych do innej usługi. HeatWave ML w pełni automatyzuje proces szkolenia i tworzy model z najlepszym algorytmem, optymalnymi cechami i parametrami dla danego zbioru danych i określonego zadania.
Żaden inny dostawca baz danych w chmurze nie udostępnia tak zaawansowanych funkcji ML bezpośrednio w swojej usłudze bazodanowej. Oracle opublikował wyniki testów ML przeprowadzonych na dużej liczbie publicznie dostępnych zbiorów, takich jak Numerai, Namao i Bank Marketing. Średnio, na najmniejszym klastrze, HeatWave ML trenuje modele uczenia maszynowego 25 razy szybciej przy jednym procencie kosztów rozwiązania Redshift ML. Przewaga wydajności nad Redshift ML jeszcze wzrasta, gdy szkolenie odbywa się na większym klastrze HeatWave. Trening jest czasochłonnym procesem, a ponieważ można go przeprowadzić bardzo sprawnie i szybko dzięki MySQL HeatWave, klienci mogą teraz częściej trenować swoje modele i nadążać za zmianami danych. Dzięki temu modele są na bieżąco aktualizowane, a dokładność przewidywań wzrasta.
„Tak jak zintegrowaliśmy analitykę i przetwarzanie transakcyjne w ramach jednej bazy danych, tak teraz wprowadzamy uczenie maszynowe do MySQL HeatWave” – powiedział Edward Screven, główny architekt korporacyjny w firmie Oracle. „MySQL HeatWave jest jedną z najszybciej rozwijających się usług chmurowych w Oracle. Coraz większa liczba klientów migruje z Amazon i innych usług baz danych w chmurze do MySQL HeatWave ze względu na znaczny wzrost wydajności i niższe koszty. Dziś ogłaszamy również szereg innych innowacji, które jeszcze bardziej wzbogacają funkcje HeatWave. Nasze nowe i w pełni przejrzyste wyniki testów porównawczych ponownie pokazują, że Snowflake, AWS, Microsoft i Google są wolniejsze i droższe niż MSQL HeatWave.”
HeatWave ML oferuje m.in. następujące możliwości:
- W pełni zautomatyzowany trening modelu: Wszystkie poszczególne etapy tworzenia modelu z HeatWave ML są w pełni zautomatyzowane i nie wymagają żadnej interwencji programistów. W rezultacie otrzymujemy model, który jest bardziej dokładny, nie wymaga ręcznej pracy, a proces szkolenia jest kompleksowy.
- Objaśnienia modeli i wnioskowania: Objaśnienia modelu pomagają programistom zrozumieć zachowanie modelu uczenia maszynowego. Na przykład, jeśli bank odmawia klientowi kredytu, trzeba określić, które parametry modelu zostały wzięte pod uwagę lub czy model zawiera jakieś błędy. Oracle rozszerzył istniejące techniki wyjaśniania, aby poprawić wydajność, interpretowalność i jakość modeli.
- Dostrajanie hiper-parametrów: HeatWave ML implementuje nowy algorytm redukcji oparty na przeszukiwaniu gradientowym do dostrajania parametrów. Dzięki temu ich wyszukiwanie może być wykonywane równolegle bez pogorszenia dokładności modelu. Strojenie jest najbardziej czasochłonnym etapem szkolenia modeli ML, a ta unikalna możliwość zapewnia HeatWave ML znaczącą przewagę wydajnościową nad innymi usługami chmurowymi.
- Wybór algorytmu: HeatWave ML używa pojęcia modeli proxy do określenia najlepszego algorytmu ML do treningu. Używając takiego modelu, wybór algorytmu jest wykonywany bardzo wydajnie bez utraty dokładności. Żadna inna usługa bazodanowa służąca do budowania modeli ML nie ma takich możliwości w zakresie modelowania przybliżonego.
- Inteligentne próbkowanie danych: Podczas szkolenia modelu, HeatWave ML pobiera próbki niewielkiego procentu danych w celu poprawy wydajności. W takiej próbce są uchwycone wszystkie reprezentatywne punkty danych. Inne usługi chmurowe do budowania modeli ML stosują mniej efektywne podejście – wykorzystują próbkowanie losowe, które próbkuje mały procent danych bez uwzględnienia ich charakterystyki.
- Selekcja cech: Selekcja cech pomaga określić atrybuty danych treningowych, które wpływają na zachowanie modelu uczenia maszynowego przy tworzeniu przewidywań. Techniki selekcji cech w HeatWave ML zostały wytrenowane na szerokiej gamie zbiorów danych z różnych dziedzin i zastosowań.
Oprócz MySQL HeatWave ML, Oracle wprowadził także dodatkowe innowacje, w tym elastyczność w czasie rzeczywistym, która umożliwia klientom zwiększanie i zmniejszanie klastra HeatWave do dowolnej liczby węzłów – bez przestojów oraz bez konieczności ręcznego równoważenia. Wprowadzono również kompresję danych, która umożliwia przetwarzanie 2 razy większej ilości danych na węzeł i obniża koszty o prawie 50 procent, przy zachowaniu tego samego stosunku ceny do wydajności. Nowa funkcja wstrzymywania i wznawiania umożliwia wstrzymanie pracy HeatWave w celu zaoszczędzenia kosztów.
„Oracle ogłosił MySQL HeatWave z Autopilotem w sierpniu zeszłego roku, co można uznać za największą innowację w chmurowych bazach danych open source w ciągu ostatnich 20 lat” – powiedział Carl Olofson, wiceprezes ds. badań nad oprogramowaniem do zarządzania danymi w IDC. „Teraz Oracle wykracza poza ogłoszone wówczas połączenie OLTP i OLAP w HeatWave, wprowadzając MySQL HeatWave ML. Oracle umieszcza całe przetwarzanie i modele uczenia maszynowego wewnątrz bazy danych, dzięki czemu klienci nie tylko nie muszą zarządzać bazami danych ML niezależnie od bazy głównej, ale także eliminują problemy związane z ETL, zyskując na szybkości, dokładności i efektywności kosztowej.”