CCA175 CCA Spark and Hadoop Developer

Opis

Egzamin CCA175 CCA Spark and Hadoop Developer bazuje na wersji oprogramowania Cloudera Distribution for Hadoop w wersji 5 – CDH5 (aktualnie jest to konkretnie wersja 5.10.0)

Gdzie

Egzamin zdawany za pośrednictwem Innovative Exams www.examslocal.com

Przebieg egzaminu:

Egzamin dostępny w języku Angielskim

Maksymalny czas trwania egzaminu: 120 minut

Egzamin praktyczny przy zastosowaniu technologii stosowanych przez Cloudera.

Przybliżona liczba pytań: 8–12 zadań praktycznych bazujących na klastrze CHD5.

Podczas egzaminu kandydat otrzymuje dostęp do swojego klastra CDH5 (wersja 5.10.0) wyposażonego w Spark, Impala, Crunch, Hive, Pig, Sqoop, Kafka, Flume, Kite, Hue, Oozie, DataFu,i wiele innych (pełna lista dostępna tutaj https://www.cloudera.com/documentation/enterprise/release-notes/topics/cdh_vd_cdh_package_tarball_510.html  ) Dodatkowo klaster posiada Python (2.6 i 3.4), Perl 5.10, Elephant Bird, Cascading 2.6, Brickhouse, Hive Swarm, Scala 2.11, Scalding, IDEA, Sublime, Eclipse, i NetBeans.

Podczas trwania egzaminu jest dostępna online następująca dokumentacja.

Cloudera Product Documentation
Apache Hadoop
Apache Hive
Apache Impala (Incubating)
Apache Sqoop
Spark
Apache Crunch
Apache Pig
Kite SDK
Apache Avro
Apache Parquet
Cloudera HUE
Apache Oozie
Apache Flume
DataFu
JDK 7 API Docs
Python 2.7 Documentation
Python 3.4 Documentation
Scala Documentation

Uwaga. Tylko dokumentacja, linki i zasoby wymienione powyżej są dostępne w czasie egzaminu. Wszystkie inne strony internetowe, w tym wszelkie wyszukiwarki internetowe jak Google są wyłączone. Podczas egzaminu nie możesz używać notatek lub innych pomocy egzaminacyjnych.

Egzamin jest zdawany pod nadzorem proktora (proktor monitoruje ezgzamin zdalnie z pomocą kamerki internetowej i mikrofonu), jest ograniczony czasowo i realizowany w bezpiecznym środowisku egzaminacyjnym przez partnera testowego Cloudera firmy Innovative Exams www.examslocal.com. Sam proces rejestracji na egzamin wymaga posiadania/założenia konta na Cloudera University https://university.cloudera.com/login.html i zakupu egzaminu z pośrednictwem strony www.cloudera.com, w kolejnym kroku otrzymuje się email z kolejnymi instrukcjami, w jaki sposób zalogować się na www.examslocal.com i ustalić termin sesji egzaminacyjnej.

Egzamin zdawany jest w dowolnym miejscu, wymagany jest komputer, kamera internetowa i mikrofon, przeglądarka internetowa Chrome lub Chromium i oczywiście połączenie internetowe, pełne wymagania znajdują się pod tym adresem https://www.examslocal.com/ScheduleExam/Home/CompatibilityCheck

Szereg pytań i odpowiedzi FAQ związanych z procedurą przystąpienia do egzaminu i jego samą realizacją http://www.cloudera.com/content/www/en-us/training/certification/faq.html

Kandydaci, którzy nie zdadzą egzaminu muszą przed ponownym podejściem odczekać minimum trzydziestu dni kalendarzowych, począwszy od dnia po nieudanej próbie. Można przystąpić do egzaminu tyle razy, ile się chce, jednak oczywiście każde podejście jest płatne. Cloudera nie oferuje żadnych zniżek dla egzaminów poprawkowych.

Uwaga. w przypadku uzyskania pozytywnego rezultatu na egzaminie nie ma możliwości jego poprawiania (np. w celu uzyskania lepszej punktacji).

Kandydaci przed przystąpieniem do egzaminu muszą zaakceptować umowę o poufności i nieujawnianiu informacji na temat przebiegu i zawartości egzaminu Cloudera Non-Disclosure and Confidentiality.

Wymagania

Pozytywny wynik egzaminu, co oznaczą wynik na poziomie minimum 70%

Cena

295 USD

Zagadnienia

Egzamin CCA175 CCA Spark and Hadoop Developer został zaprojektowany do sprawdzania praktycznej umiejętności deweloperów z następujących obszarów:

Data Ingest

The skills to transfer data between external systems and your cluster. This includes the following:

  • Import data from a MySQL database into HDFS using Sqoop
  • Export data to a MySQL database from HDFS using Sqoop
  • Change the delimiter and file format of data during import using Sqoop
  • Ingest real-time and near-real time (NRT) streaming data into HDFS using Flume
  • Load data into and out of HDFS using the Hadoop File System (FS) commands

Transform, Stage, Store

Convert a set of data values in a given format stored in HDFS into new data values and/or a new data format and write them into HDFS. This includes writing Spark applications in both Scala and Python:

  • Load data from HDFS and storing results back to HDFS using Spark
  • Join disparate datasets together using Spark
  • Calculate aggregate statistics (e.g., average or sum) using Spark
  • Filter data into a smaller dataset using Spark
  • Write a query that produces ranked or sorted data using Spark

Data Analysis

Use DDL (Data Definition Language) in order to create tables in the Hive metastore for use by Hive and Impala.

  • Read and/or create a table in the Hive metastore in a given schema
  • Extract an Avro schema from a set of datafiles using avro-tools
  • Create a table in the Hive metastore using the Avro file format and an external schema file
  • Improve query performance by creating partitioned tables in the Hive metastore
  • Evolve an Avro schema by changing JSON files

Dodatkowe informacje

Jak się przygotować:
Cloudera udostępnia wiele zasobów, które pomagają w przygotowaniu się do certyfikowanych egzaminów, począwszy od ogólnodostępnej dokumentacji, bazy wiedzy po autoryzowane szkolenia stacjonarne i w wersji online. Poniższe kroki stanowią proponowaną „drogę do sukcesu” jakim jest pozytywny rezultat na egzaminie CCA175 CCA Spark and Hadoop Developer

Sugerowane

Jak w przypadku wszystkich egzaminów i certyfikacji Cloudera udział w autoryzowanym szkoleniu nie jest wymagany a jedynie jest krokiem sugerowanym.

Udział w następujących szkoleniach dotyczących Apache Spark:

Developer Training For Spark and Hadoop

Wysoce rekomendowane
Upewnienie się, że wszystkie przedstawione zagadnienia egzaminacyjne są kandydatowi bardzo dobrze znane zarówno od strony teoretycznej jak i praktycznej.

Dodatkowe zasoby pozwalające na lepsze przygotowanie się do egzaminu CCA