Free Databricks Databricks-Certified-Professional-Data-Engineer Korean Practice Test & Real Exam Questions

  • Exam Code/Number: Databricks-Certified-Professional-Data-Engineer Korean
  • Exam Name/Title: Databricks Certified Professional Data Engineer Exam (Databricks-Certified-Professional-Data-Engineer Korean Version)
  • Certification Provider: Databricks
  • Corresponding Certification: Databricks Certification
  • Exam Questions: 217
  • Updated On: Jun 26, 2026
데이터 엔지니어가 사용자 ID별로 그룹화된 대규모 사용자 활동 로그에 대해 groupBy 집계를 실행하고 있습니다. 일부 사용자는 수백만 건의 기록을 보유하고 있어 작업 불균형과 긴 실행 시간을 초래하고 있습니다.
이 집계의 불균형을 바로잡을 수 있는 기술은 무엇일까요?
Correct Answer: A Vote an answer
Explanation: Only visible for Pass4Leader members. You can sign-up / login (it's free).
신입 데이터 엔지니어가 관계형 데이터베이스 시스템의 워크로드를 Databricks Lakehouse로 마이그레이션하고 있습니다. 소스 시스템은 스타 스키마를 사용하며, 외래 키 제약 조건과 다중 테이블 삽입을 활용하여 레코드 쓰기 시 유효성을 검사합니다.
이 워크로드를 마이그레이션하는 동안 엔지니어의 결정에 영향을 미치는 고려 사항은 무엇입니까?
Correct Answer: C Vote an answer
Explanation: Only visible for Pass4Leader members. You can sign-up / login (it's free).
PySpark에서 ETL 코드에 DataFrame.transform을 사용하는 모듈식 및 테스트 가능한 방법을 보여주는 접근 방식은 무엇입니까?
Correct Answer: B Vote an answer
Explanation: Only visible for Pass4Leader members. You can sign-up / login (it's free).
데이터 과학 팀은 사용자 리뷰의 자유 형식 텍스트에 대한 쿼리 속도를 높이는 데 도움을 요청했습니다.
현재 데이터는 아래와 같은 스키마를 가진 Parquet 형식으로 저장되어 있습니다.
item_id INT, user_id INT, review_id INT, rating FLOAT, review STRING
리뷰 열에는 사용자가 남긴 리뷰 전문이 포함되어 있습니다. 데이터 과학 팀은 특히 이 필드에 30개의 핵심 단어가 있는지 여부를 확인하고자 합니다.
신입 데이터 엔지니어가 이 데이터를 Delta Lake로 변환하면 쿼리 성능이 향상될 것이라고 제안했습니다.
주니어 데이터 엔지니어의 제안에 대한 다음 답변 중 올바른 것은 무엇입니까?
Correct Answer: A Vote an answer
Explanation: Only visible for Pass4Leader members. You can sign-up / login (it's free).
Databricks 워크스페이스 관리자는 각 데이터 엔지니어링 그룹에 대해 대화형 클러스터를 구성했습니다. 비용 관리를 위해 클러스터는 30분 동안 활동이 없으면 종료되도록 설정되어 있습니다. 각 사용자는 하루 중 언제든지 할당된 클러스터에서 워크로드를 실행할 수 있어야 합니다.
사용자가 워크스페이스에 추가되었지만 권한이 부여되지 않은 경우, 이미 구성된 클러스터를 시작하고 연결하는 데 필요한 최소 권한은 다음 중 무엇입니까?
Correct Answer: D Vote an answer
Explanation: Only visible for Pass4Leader members. You can sign-up / login (it's free).
데이터 엔지니어 팀은 Databricks에서 기본적으로 지원하지 않는 외부 데이터베이스에 대한 연결을 구성하는 작업을 맡았습니다. 해당 외부 데이터베이스는 이미 그룹 멤버십을 기반으로 데이터 보안이 구성되어 있습니다. 이러한 그룹은 회사 내 다양한 ​​팀을 대표하는 Databricks에 이미 생성된 사용자 그룹에 직접 매핑됩니다.
외부 데이터베이스의 각 그룹에 대해 새 로그인 자격 증명이 생성되었습니다. Databricks 유틸리티 비밀 모듈을 사용하여 이러한 자격 증명을 Databricks 사용자에게 제공할 수 있습니다.
외부 데이터베이스에 모든 자격 증명이 올바르게 구성되어 있고 Databricks에 그룹 멤버십이 제대로 구성되어 있다고 가정할 때, 팀에게 이러한 자격 증명을 사용하는 데 필요한 최소한의 액세스 권한을 부여하는 방법을 설명하는 문장은 무엇입니까?
Correct Answer: C Vote an answer
Explanation: Only visible for Pass4Leader members. You can sign-up / login (it's free).
Apache Kafka 프로듀서의 모든 레코드가 다음 스키마를 가진 단일 Delta Lake 테이블로 수집되고 있습니다.
키는 BINARY, 값은 BINARY, 토픽은 STRING, 파티션은 LONG, 오프셋은 LONG, 타임스탬프는 LONG 형식입니다. 수집되는 토픽은 총 5개이며, "등록" 토픽에만 개인 식별 정보(PII)가 포함되어 있습니다. 회사는 PII에 대한 접근을 제한하고자 하며, PII가 포함된 기록은 최초 수집 후 14일 동안만 보관하기를 원합니다. PII가 아닌 정보는 무기한으로 보관하고자 합니다.
다음 중 요구 사항을 충족하는 해결책은 무엇입니까?
Correct Answer: C Vote an answer
Explanation: Only visible for Pass4Leader members. You can sign-up / login (it's free).
Delta Lake 테이블을 사용하는 하위 사용자들이 데이터 품질 문제로 인해 애플리케이션 성능이 저하되고 있다고 불만을 제기하고 있습니다. 특히, activity_details 테이블의 유효하지 않은 위도 및 경도 값으로 인해 다른 지리 위치 정보 처리 기능을 사용할 수 없게 되었다고 합니다.
신입 엔지니어가 Delta Lake 테이블에 CHECK 제약 조건을 추가하는 다음 코드를 작성했습니다.

선임 엔지니어가 위 논리가 정확하고 위도와 경도의 유효 범위가 제공되었음을 확인했지만, 코드를 실행하면 오류가 발생합니다.
다음 중 이 실패의 원인을 설명하는 진술은 무엇입니까?
Correct Answer: E Vote an answer
Explanation: Only visible for Pass4Leader members. You can sign-up / login (it's free).
프로덕션 환경에 배포된 구조화된 스트리밍 작업이 하루 중 사용량이 많은 시간대에 지연 현상을 보이고 있습니다. 현재 정상적인 실행 시에는 각 마이크로배치 데이터 처리 시간이 3초 미만입니다. 하지만 사용량이 많은 시간대에는 각 마이크로배치의 처리 시간이 매우 불규칙해지며, 때로는 3초를 초과하기도 합니다.
30초. 스트리밍 쓰기는 현재 10초의 트리거 간격으로 구성되어 있습니다.
다른 모든 변수를 일정하게 유지하고 레코드를 10초 이내에 처리해야 한다고 가정할 때, 어떤 조정이 요구 사항을 충족할까요?
Correct Answer: B Vote an answer
Explanation: Only visible for Pass4Leader members. You can sign-up / login (it's free).
데이터 엔지니어가 Databricks의 Lakeflow Declarative Pipelines(LDP)를 사용하여 고객 데이터를 수집하는 간단한 데이터 파이프라인을 구축하고 있습니다. 원시 고객 데이터는 클라우드 스토리지에 JSON 형식으로 저장되어 있습니다. 이 작업은 원시 JSON 데이터를 읽어 추가 처리를 위해 Delta 테이블에 쓰는 Lakeflow Declarative Pipelines를 생성하는 것입니다.
어떤 코드 조각이 원시 JSON 데이터를 올바르게 가져와 LDP를 사용하여 델타 테이블을 생성합니까?
Correct Answer: B Vote an answer
Explanation: Only visible for Pass4Leader members. You can sign-up / login (it's free).