Free Databricks Databricks-Certified-Professional-Data-Engineer Korean Practice Test & Real Exam Questions
데이터 엔지니어가 데이터 편향과 빈번하게 변경되는 쿼리 필터 열로 인해 문제가 발생하는 관리형 델타 테이블을 최적화하고 있습니다. 엔지니어는 쿼리 패턴이 변화할 때 발생하는 비용이 많이 드는 데이터 재작성을 피하고자 합니다. 테이블 크기는 1TB 미만입니다.
데이터 엔지니어는 어떻게 이 요구 사항을 충족해야 할까요?
데이터 엔지니어는 어떻게 이 요구 사항을 충족해야 할까요?
Correct Answer: D
Vote an answer
Explanation: Only visible for Pass4Leader members. You can sign-up / login (it's free).
데이터 엔지니어가 Databricks 간 데이터 전송 시나리오에서 읽기 성능을 최적화하기 위해 델타 공유(Delta Sharing)를 구성하고 있습니다. 수신 측에서는 공유된 판매 데이터에 대해 시간 경과에 따른 쿼리와 스트리밍 읽기를 수행해야 합니다.
어떤 구성이 이러한 기능들을 활성화하면서 최적의 성능을 제공할까요?
어떤 구성이 이러한 기능들을 활성화하면서 최적의 성능을 제공할까요?
Correct Answer: D
Vote an answer
Explanation: Only visible for Pass4Leader members. You can sign-up / login (it's free).
새로운 데이터 엔지니어가 Kafka 소스 데이터를 Delta Lake에 저장하는 애플리케이션에서 중요한 필드가 누락된 것을 발견했습니다. 해당 필드는 Kafka 소스 데이터에는 분명히 존재했음에도 불구하고 누락되었습니다. 더 나아가, 종속적인 장기 저장소에 저장되는 데이터에서도 해당 필드가 누락된 것이 확인되었습니다. Kafka 서비스의 데이터 보존 기간은 7일입니다. 해당 데이터 파이프라인은 3개월 동안 운영되어 왔습니다.
이는 델타 레이크가 향후 이와 같은 데이터 손실을 방지하는 데 어떻게 도움이 될 수 있는지를 설명하는 내용입니다.
이는 델타 레이크가 향후 이와 같은 데이터 손실을 방지하는 데 어떻게 도움이 될 수 있는지를 설명하는 내용입니다.
Correct Answer: B
Vote an answer
Explanation: Only visible for Pass4Leader members. You can sign-up / login (it's free).
데이터 엔지니어가 세 개의 노트북을 오케스트레이션하는 멀티태스킹 Databricks 작업을 배포합니다. 그중 한 작업이 간헐적으로 종료 코드 1로 실패하지만 재시도하면 성공합니다. 엔지니어는 실패한 시도에 대한 자세한 로그(표준 출력/표준 오류 및 클러스터 수명 주기 컨텍스트 포함)를 수집하여 플랫폼 팀과 공유해야 합니다.
데이터 엔지니어는 내장 도구를 사용하여 어떤 단계를 따라야 합니까?
데이터 엔지니어는 내장 도구를 사용하여 어떤 단계를 따라야 합니까?
Correct Answer: A
Vote an answer
Explanation: Only visible for Pass4Leader members. You can sign-up / login (it's free).
데이터 엔지니어가 Lakeflow Declarative Pipeline을 사용하여 소스 브론즈 테이블(user_bronze)에서 대상 실버 테이블(user_silver)로 행 삭제를 전파하고 있습니다. 이 엔지니어는 파이프라인 실행 중에 user_bronze 테이블에서 행이 삭제되면 user_silver 테이블에서도 해당 행이 자동으로 삭제되도록 하기를 원합니다.
어떤 설정을 해야 브론즈 테이블에서 삭제된 내용이 실버 테이블로 전파됩니까?
어떤 설정을 해야 브론즈 테이블에서 삭제된 내용이 실버 테이블로 전파됩니까?
Correct Answer: B
Vote an answer
Explanation: Only visible for Pass4Leader members. You can sign-up / login (it's free).
데이터 엔지니어는 Spark의 MEMORY_ONLY 저장 레벨을 사용하고 있습니다.
데이터 엔지니어는 Spark UI의 스토리지 탭에서 캐시된 테이블의 성능이 최적화되지 않았음을 나타내는 어떤 지표를 찾아야 할까요?
데이터 엔지니어는 Spark UI의 스토리지 탭에서 캐시된 테이블의 성능이 최적화되지 않았음을 나타내는 어떤 지표를 찾아야 할까요?
Correct Answer: D
Vote an answer
Explanation: Only visible for Pass4Leader members. You can sign-up / login (it's free).
태스크 오케스트레이터가 한 시간 간격으로 두 개의 작업을 실행하도록 구성되었습니다. 첫 번째 작업은 외부 시스템에서 Parquet 데이터를 /mnt/raw_orders/에 마운트된 디렉터리에 기록하는 것입니다. 이 데이터가 기록된 후, 다음 코드가 포함된 Databricks 작업이 실행됩니다.
(spark.readStream
.format( " parquet " )
.load( " /mnt/raw_orders/ " )
.withWatermark( " time " , " 2 hours " )
.dropDuplicates([ " customer_id " , " order_id " ])
.writeStream
.trigger(once=True)
.table( " orders " )
)
customer_id와 order_id 필드가 각 주문을 고유하게 식별하는 복합 키 역할을 하고, time 필드는 소스 시스템에서 레코드가 대기열에 추가된 시간을 나타낸다고 가정합니다. 상위 시스템에서 단일 주문에 대해 몇 시간 간격으로 중복 항목이 대기열에 추가되는 경우가 있는 것으로 알려져 있다면, 다음 중 어떤 설명이 정확합니까?
(spark.readStream
.format( " parquet " )
.load( " /mnt/raw_orders/ " )
.withWatermark( " time " , " 2 hours " )
.dropDuplicates([ " customer_id " , " order_id " ])
.writeStream
.trigger(once=True)
.table( " orders " )
)
customer_id와 order_id 필드가 각 주문을 고유하게 식별하는 복합 키 역할을 하고, time 필드는 소스 시스템에서 레코드가 대기열에 추가된 시간을 나타낸다고 가정합니다. 상위 시스템에서 단일 주문에 대해 몇 시간 간격으로 중복 항목이 대기열에 추가되는 경우가 있는 것으로 알려져 있다면, 다음 중 어떤 설명이 정확합니까?
Correct Answer: D
Vote an answer
Explanation: Only visible for Pass4Leader members. You can sign-up / login (it's free).
Databricks CLI는 job_id 매개변수를 전달하여 기존 작업을 실행하는 데 사용됩니다. 작업 실행 요청이 성공적으로 제출되었다는 응답에는 run_id 필드가 포함됩니다.
다음 중 이 항목 옆의 숫자가 나타내는 바를 설명하는 문장은 무엇입니까?
다음 중 이 항목 옆의 숫자가 나타내는 바를 설명하는 문장은 무엇입니까?
Correct Answer: B
Vote an answer
Explanation: Only visible for Pass4Leader members. You can sign-up / login (it's free).
워크스페이스 관리자가 finance_data라는 새 카탈로그를 생성했고, 재무팀 리더에게 전체 관리자 권한을 부여하지 않고 권한 관리 권한만 위임하려고 합니다.
재무팀장에게 어떤 권한을 부여해야 할까요?
재무팀장에게 어떤 권한을 부여해야 할까요?
Correct Answer: C
Vote an answer
Explanation: Only visible for Pass4Leader members. You can sign-up / login (it's free).
다음 중 통합 테스트를 설명하는 문장은 무엇입니까?
Correct Answer: E
Vote an answer
Explanation: Only visible for Pass4Leader members. You can sign-up / login (it's free).
