

# **stm32f429-DMA Tutorial**

**제작자: 유영재**

## 목차

|     |                                     |    |
|-----|-------------------------------------|----|
| 1.  | DMA 소개 .....                        | 3  |
| 1.1 | Master-slave system.....            | 3  |
| 1.2 | DMA 사용 예 .....                      | 4  |
| 1.3 | MCU Block Diagram .....             | 5  |
| 1.4 | Bus matrix.....                     | 10 |
| 1.5 | Interrupt와 DMA 비교.....              | 16 |
| 2.  | DMA 예제.....                         | 21 |
| 2.1 | LED Toggle.....                     | 21 |
| 2.2 | LED Toggle with Interrupt.....      | 28 |
| 2.3 | DMA를 이용한 SRAM 간 데이터 공유 .....        | 31 |
| 2.4 | DMA1으로 했을 때의 오류 발생.....             | 34 |
| 2.5 | DMA를 이용한 UART-SRAM 데이터 공유.....      | 35 |
| 3.  | DMA 고급 개념.....                      | 41 |
| 3.1 | DMA Slave Port .....                | 41 |
| 3.2 | DMA peripheral and memory port..... | 42 |
| 3.3 | DMA Stream .....                    | 43 |
| 3.4 | DMA Channel .....                   | 46 |
| 4.  | DMA 실습.....                         | 50 |
| 4.1 | CubeMX 설정 .....                     | 51 |
| 4.2 | 프로그램 코드 작성.....                     | 54 |
| 5.  | DMA 고급 개념.....                      | 57 |
| 5.1 | Arbiter .....                       | 57 |
| 5.2 | Fifo.....                           | 58 |
| 6.  | OV2640 카메라 모듈 제어.....               | 60 |
|     | * 참고 (FSMC, FMC) .....              | 65 |
| 6.1 | 프로그램 개요 .....                       | 81 |

# 1. DMA 소개

- DMA는 Direct Memory Access의 약자로 최근 MCU에는 기본적으로 들어가 있는 Peripheral 중 하나다. 현재 우리가 다룰 arm-cortex M4 기반의 stm32f429 도 총 2개의 dma 컨트롤러가 내장되어 있다. **dma를 이해하기 위해선 arm-cortex의 버스 시스템을 이해하고 있어야 한다**

## 1.1 Master-slave system

아래 그림은 ARM의 버스 시스템을 나타낸 것이다. ARM 버스 시스템은 기본적으로 CPU와 주변 Peripheral들은 버스로 연결되어 있는 것을 볼 수 있다. 예를 들어 전역 변수에 ADC 데이터 레지스터 값을 저장하려고 한다



- A. 하나의 상황을 예를 들어서 설명을 해보려고 한다. ADC에 이벤트가 발생해서 digitize 된 값이 ADC 데이터 레지스터로 써지게 된다
- B. 그러면 ADC는 CPU에게 Event를 발생시켜서 CPU는 해당 데이터를 프로세서 레지스터에 저장한 이후 SRAM 메모리에 쓸 수 있게 된다
- C. 위에서 설명했듯이 총 2개의 경로로 데이터는 메모리에 써지게 된다. **그러면 바로 ADC DR 값이 메모리로 쓸 수는 없을까?**
- D. 답은 그렇게 할 수 없다. 왜냐하면 명령어 중 하나인 load는 CPU만 가지고 있기 때문이다. 즉 각 주변장치들은 두뇌가 없기 때문에 해당 명령을 실행할 수 없다. 그래서 매번 CPU의 도움을 받기 위해서 Event를 발생시키는 것이다
- E. 그래서 **버스 시스템에서 버스를 컨트롤 할 수 있는 기능을 가지고 있는 것은 master라고 부르며, 아닌 것은 slave라고 칭한다**. 그래서 slave끼리는 버스를 끼고 데이터 공유가 불가능한 것이다
- F. 그러면 CPU 말고도 master 역할을 대신 할 수 있는 것은 없나? 그 역할을 하는 것이 바로 DMA controller다.

- G. DMA 컨트롤러가 master라고 지칭할 수 있어도, 명령어(instruction)를 제공하는 장치는 CPU밖에 존재하지 않는다. 다만 DMA가 하드웨어 로직으로 CPU의 일을 offload할 수 있게 설계되어 있을 뿐이다. 그래서 도움을 받아 버스를 control 할 수 있게 된다



## 1.2 DMA 사용 예

- DMA가 CPU load를 덜어주는 역할을 한다고 하지만, 언제 사용하게 되는가? 단순하게 CPU가 하나의 일만 수행을 한다면 굳이 사용할 필요는 없다. 다음과 같은 예를 들어보기로 한다



- A. 두 인터럽트가 동시에 config되어 있고, ADC, UART 모두 동시에 들어오는 상황이라고 가정을 한다. 인터럽트로 받은 데이터를 모두 메모리에 저장해야 하는 상황이다
- B. ADC 우선순위가 더 높은 상황이고, 데이터는 두 주변장치에서 지속적으로 들어오고 있다. 그래서 ADC는 데이터가 지속적으로 SRAM에 저장되지만, UART는 그렇지 않다
- C. 이럴 때 UART 데이터 손실을 막기 위해서 UART 데이터는 DMA 컨트롤러로 처리를 하게 하는 것이다. 따라서 DMA를 거쳐 SRAM으로 저장되게 된다
  
- 그리고 두번째 이유로 뒤에 실험을 하겠지만, ARM ON일 때와 ARM OFF/DMA ON일 때의 전류를 비교하면 차이가 생기게 된다. 전력을 아끼는 쪽이 DMA이기 때문에 좋은 Application에는 DMA 사용이 반드시 따라오게 된다

### 1.3 MCU Block Diagram

MCU Block Diagram은 DMA를 이해하는 데 반드시 숙지해야 하는 부분이다. RM 문서 2장 Memory and bus architecture을 보면 위에서 언급한 master/slave 개념이 드러나고 있다. stm32f429에는 2개의 DMA를 포함해서 10개의 master 버스가 존재한다

In the STM32F42xx and STM32F43xx devices, the main system consists of 32-bit multilayer AHB bus matrix that interconnects:

- Ten masters:
  - Cortex<sup>®</sup>-M4 with FPU core I-bus, D-bus and S-bus
  - DMA1 memory bus
  - DMA2 memory bus
  - DMA2 peripheral bus
  - Ethernet DMA bus
  - USB OTG HS DMA bus
  - LCD Controller DMA-bus
  - DMA2D (Chrom-Art Accelerator™) memory bus
- Eight slaves:
  - Internal Flash memory ICode bus
  - Internal Flash memory DCode bus
  - Main internal SRAM1 (112 KB)
  - Auxiliary internal SRAM2 (16 KB)
  - Auxiliary internal SRAM3 (64 KB)
  - AHB1peripherals including AHB to APB bridges and APB peripherals
  - AHB2 peripherals
  - FMC

The bus matrix provides access from a master to a slave, enabling concurrent access and efficient operation even when several high-speed peripherals work simultaneously. The 64-Kbyte CCM (core coupled memory) data RAM is not part of the bus matrix and can be accessed only through the CPU. This architecture is shown in [Figure 2](#).

## A. Master

### a. Core I-bus, S-bus, D-bus



### b. 다른 Master



참고로 DMA controller에서 두 갈래의 길로 나눠진다. 하나는 memory쪽 버스와 나머지 는 peripheral쪽 버스가 된다. 아래 버스에서 빨간색이 memory, 파란색이 peripheral로 해당된다



따라서 DMA 컨트롤러를 통해서 M2M, P2M, M2P가 가능하게 된다

## B. Slave

### a. Flash I-code, D-code, SRAM



### b. AHB1은 APB1, 2 버스를 포함하고 있다



c. AHB2



d. FMC



## 1.4 Bus matrix

- RM 데이터시트에는 바로 밑 페이지에 위 내용을 matrix 형식으로 정리한 diagram을 제공하고 있다. 아래 matrix로 DMA를 좀 더 쉽게 이해해 보고자 한다

Figure 2. System architecture for STM32F42xxx and STM32F43xxx devices



### A. Master

Figure 2. System architecture for STM32F42xxx and STM32F43xxx devices



Q. ARM과 DMA를 제외한 나머지들이 master 역할을 할 수 있는 이유는?

- in this MCU, we have advance peripherals that uses an advanced bus matrix interconnect on which the USB, TFT, Ethernet acts as a master which means it can do its own memory transfer based on the software configuration.

## B. Slave

Figure 2. System architecture for STM32F42xxx and STM32F43xxx devices



## C. Matrix 보는 법

Figure 2. System architecture for STM32F42xxx and STM32F43xxx devices



빨간색 박스가 쳐진 부분은 연결된 부분을 뜻한다. 따라서 ARM 코어를 기반으로 보면 Flash 메모리와는 I-bus와 D-bus로 내용을 주고받는 것을 볼 수 있다. 또한 SRAM2, SRAM3, rr 다른 peripheral bus에는 S-bus만 접근 가능한 것을 확인할 수 있다

## D. DMA Matrix

Figure 2. System architecture for STM32F42xxx and STM32F43xxx devices



stm32f429에는 총 2개의 DMA 컨트롤러가 존재하고 있다. 각 컨트롤러에는 DMA\_P1, DMA\_MEM1 2가지 줄기가 뻗어져 있다. 선을 잘 따라가보면 Px 라인에는 APB1, 2와 연결되어 있다. 추측해보면 peripheral과 memory 사이의 처리는 dma 컨트롤러를 통해서 처리될 수 있는 것으로 보인다.

또한 DMA2는 AHB 사이의 처리도 담당해줄 수 있는 것으로 보인다. 다만 DMA1은 P2M(Peripheral to Memory)만 가능한 것을 볼 수 있다

Figure 2. System architecture for STM32F42xxx and STM32F43xxx devices



## E. 상황 예제

예를 들어 SPI2의 데이터를 SRAM1으로 쓰고 싶을 때 어떻게 DMA Path는 구성될 수 있을까?

먼저 SPI2는 APB1 버스에 연결된 것을 확인할 수 있다



Bus matrix로 봤을 때 APB1은 DMA1\_P1과 연결되어 있는 것을 볼 수 있다

Figure 2. System architecture for STM32F42xxx and STM32F43xxx devices



그러면 다음과 같은 path로 DMA1을 통해서 SRAM1 데이터 저장이 가능하다. 다음 path를 확인하면 ARM 코어를 전혀 거치지 않는다는 점을 확인할 수 있다

Figure 2. System architecture for STM32F42xxx and STM32F43xxx devices



#### F. ARM 코어를 통한 Path (SPI2, AHB1 peripheral)

Figure 2. System architecture for STM32F42xxx and STM32F43xxx devices



## G. DMA와 ARM 코어를 이용한 동시 데이터 전달

위의 내용을 종합해보면 DMA는 ARM과 별개로 데이터 처리를 할 수 있도록 되어 있다. 예를 들어, 1) **UART 데이터를 SRAM1에 저장** 2) **ADC 데이터를 SRAM2에 저장**이 아래 Path와 같이 동시에 별도로 동작이 가능하다

Figure 2. System architecture for STM32F42xxx and STM32F43xxx devices



## H. 만일 RAM 메모리가 SRAM1 하나만 존재한다면, 동시에 SRAM1에 저장하는 길을 동시에 이용하게 된다. 순간적인 동시 이용은 불가능하기 때문에 priority가 높은 master가 먼저 bus를 선점하게 된다

이렇게 되면 데이터를 잃을 수도 있지만, DMA에는 따로 FIFO가 존재하기 때문에 손실없이 bus의 기회가 올때까지 기다리게 된다

## 1.5 Interrupt와 DMA 비교

- 두 프로그램을 구성해서 비교해보려고 한다. 하나는 ARM 코어가 지속적으로 while 무한루프를 수행하고 있는데, 인터럽트로 코어가 다른 일을 처리하게끔 하는 것이다. 나머지는 DMA로 코어가 일을 멈추는 것 없이 DMA 컨트롤러에 일을 맡기는 것이다
- User Application은 SRAM1에 지속적으로 데이터를 쓰는 작업을 하는 것이다

```
/* USER CODE BEGIN 0 */
uint8_t src_data[50];
#define OFF_SET 0X500
#define DEST_ADDRESS (volatile uint8_t*) (SRAM1_BASE + OFF_SET)

for( uint32_t i = 0 ; i < 50 ; i++)
{
    src_data[i] = 0xAA;
}

// receive 250 bytes
HAL_UART_Receive_IT(&huart1,(uint8_t*)SRAM2_BASE, 250);
/* USER CODE END 2 */

/* Infinite loop */
/* USER CODE BEGIN WHILE */
while (1)
{
    /* USER CODE END WHILE */

    /* USER CODE BEGIN 3 */
        HAL_GPIO_WritePin(GPIOG,GPIO_PIN_13,GPIO_PIN_SET);

        for( i = 0 ; i < 50 ; i++)
        {
            *(DEST_ADDRESS+i) = src_data[i];

        }
        HAL_GPIO_WritePin(GPIOG,GPIO_PIN_13,GPIO_PIN_RESET);
    }
}
}
```

- A. Logic 분석기로 총 3가지 신호를 파악하려고 한다. While 루프에서 GPIOG\_13에 대한 set, unset을 보려고 한다
- B. 그리고 UART 인터럽트를 1바이트 받을 때마다, 250바이트를 모두 받을 때까지의 신호를 측정하려고 한다

```
void HAL_UART_RxCpltCallback(UART_HandleTypeDef *huart)
{
    /* Prevent unused argument(s) compilation warning */
    // UNUSED(huart);
    HAL_GPIO_WritePin(GPIOG, GPIO_PIN_14, GPIO_PIN_SET);
    HAL_GPIO_WritePin(GPIOG, GPIO_PIN_14, GPIO_PIN_RESET);

    HAL_UART_Receive_IT(&huart1,(uint8_t*)SRAM2_BASE, 250);
    /* NOTE: This function Should not be modified, when the callback is
needed,
        the HAL_UART_TxCpltCallback could be implemented in the user file
    */
}
```

```

void USART1_IRQHandler(void)
{
    /* USER CODE BEGIN USART1_IRQHandler_0 */
    HAL_GPIO_WritePin(GPIOG,GPIO_PIN_12,GPIO_PIN_SET);
    /* USER CODE END USART1_IRQHandler_0 */
    HAL_UART_IRQHandler(&huart1);
    /* USER CODE BEGIN USART1_IRQHandler_1 */
    HAL_GPIO_WritePin(GPIOG,GPIO_PIN_12,GPIO_PIN_SET);
    /* USER CODE END USART1_IRQHandler_1 */
}

```

- C. 코드를 다운로드 한 후 ARM 코어가 SRAM2에 Write를 하는 시간을 측정해보려고 한다. Sample Rate는 측정하고자 하는 주파수의 5배로 지정한다. 현재 16MHz의 클럭으로 동작하고 있기 때문에, 여러 실험을 통해 약 5MHz 이상의 Sample Rate에서 정확한 측정을 할 수 있었다. 그렇지 않으면 신호를 놓치게 되었다

따라서 아래 측정 결과를 보면 인터럽트가 없을 때는 약 29us에 SRAM1에 데이터를 모두 쓰게 된다



- D. 그리고 인터럽트를 발생시켰을 때는 47us라는 긴 시간이 걸린 것을 볼 수 있다



- E. 이제는 DMA 코드를 넣어서 실행해보려고 한다. 먼저 CubeMX로 설정을 하도록 한다. 자세한 내용은 이후에 다루려고 한다



- F. 그리고 소스코드를 인터럽트가 아닌 DMA로 받도록 한다

```

void HAL_UART_RxCpltCallback(UART_HandleTypeDef *huart)
{
    /* Prevent unused argument(s) compilation warning */
    // UNUSED(huart);
    HAL_GPIO_WritePin(GPIOG, GPIO_PIN_14, GPIO_PIN_SET);
    HAL_GPIO_WritePin(GPIOG, GPIO_PIN_14, GPIO_PIN_RESET);

    HAL_UART_Receive_DMA(&huart1, (uint8_t*)SRAM2_BASE, 250);
    /* NOTE: This function Should not be modified, when the callback
     * is needed,
     * the HAL_UART_TxCpltCallback could be implemented in the
     * user file
    */

    // HAL_UART_Receive_IT(&huart1, (uint8_t*)SRAM2_BASE, 250);
    HAL_UART_Receive_DMA(&huart1, (uint8_t*)SRAM2_BASE, 250);
    /* USER CODE END 2 */

    /* Infinite loop */
    /* USER CODE BEGIN WHILE */
    while (1)
    {

        /* USER CODE END WHILE */

        /* USER CODE BEGIN 3 */
        HAL_GPIO_WritePin(GPIOG, GPIO_PIN_13, GPIO_PIN_SET);

        for( i = 0 ; i < 50 ; i++)
        {
            *(DEST_ADDRESS+i) = src_data[i];
        }
    }
}

```

```

    }
    HAL_GPIO_WritePin(GPIOG, GPIO_PIN_13, GPIO_PIN_RESET);
}

```

프로그램을 다운로드 한 후 측정을 하면 UART 데이터를 넣지 않았을 때는 28us로 기존 인터럽트와 비슷했다



G. DMA를 통해 지속적으로 250바이트를 송신해도 while문 안에는 28us를 유지하는 것을 볼 수 있다



그리고 인터럽트 때만 ARM 코어가 DMA handler를 처리하는 것을 볼 수 있다. 코드 흐름 자체는 DMA 핸들러가 모든 바이트를 받은 후 UART로 전달한다는 것을 디버깅을 통해서 확인 할 수 있었다. 그리고 DMA 핸들러는 UART 수신보다 2배로 반응하는 것을 알 수 있었다. 이는 ARM 코어에서 처리되는 부분이기 때문이다



정확한 내용은 추후에 알아보려고 한다 (DMA IRQ Handler는 half 때마다 한 번씩 들어온다. 그리고 안에서 콜백 함수가 등록될 때 half complete 때라면 콜백 함수를 호출하는 구조다. 따라서 실제로는 2배로 신호가 뛰는 것이다)

### ● 참고

시리얼을 통한 파일 전송을 tera term의 send file을 이용하도록 한다



## 2. DMA 예제

- 간단히 DMA 예제를 작성해서 DMA API와 Bus Matrix를 이해해보려고 한다

### 2.1 LED Toggle

- SRAM 데이터를 LED와 연결되어 있는 GPIO 데이터 레지스터를 쓰려고 한다. stm32f429의 GPIO는 AHB1 버스에 연결되어 있다



- 그러면 SRAM과 AHB1 버스와 통신할 수 있는 DMA Controller를 알아봐야 한다

Figure 2. System architecture for STM32F429xx and STM32F439xx devices



그래서 matrix 길을 따라가보면 다음과 같이 표현할 수 있다

Figure 2. System architecture for STM32F42xxx and STM32F43xxx devices



- Bus matrix에서 DMA는 2가지 포트가 나와있는 것을 볼 수 있다. 하나는 Memory, 나머지는 Peripheral 포트다. 이는 MCU 벤더에 따라 이름 짓는 것이 자유인데, 확장해보면 주변장치는 곧 메모리 mapped로 바꿔 말할 수 있다. 따라서 의미상 나눈 것으로 확인된다



The DMA controller performs direct memory transfer: as an AHB master, it can take the control of the AHB bus matrix to initiate AHB transactions.

It can carry out the following transactions:

- peripheral-to-memory
- memory-to-peripheral
- memory-to-memory

The DMA controller provides two AHB master ports: the *AHB memory port*, intended to be connected to memories and the *AHB peripheral port*, intended to be connected to peripherals. However, to allow memory-to-memory transfers, the *AHB peripheral port* must also have access to the memories.

The AHB slave port is used to program the DMA controller (it supports only 32-bit accesses).

- 데이터시트에서는 추가적으로 Peripheral 포트는 곧 memory에도 접근할 수 있다고 나와있기 때문에 어느정도 위의 말과 일맥상통한다. 따라서 DMA2로는 APB2와 연결된 메모리를 제외하고 접근이 가능하다
- 헷갈렸던 부분이 AHB1이 APB1, 2와 합쳐 있는 것으로 알았는데, 그것이 아니라 AHB1에 단독으로 연결되어 있는 주변장치가 있다. 아래 표시해둔 것이 그러한 주변장치들이다



A. 이제 코드를 작성해보려고 한다



- B. 그래서 AHB1(GPIO 포트)은 DMA2에 연결되어 있기 때문에 아무 stream으로 지정하도록 한다. 뒤에서 stream과 channel에 대해서 자세하게 다룰 것이다



그리고 자동으로 주소를 증가시키는 것이 아닌, 코드로 직접적으로 주소를 증가시킬 것이다



C. 현재는 interrupt가 아닌 polling으로 DMA를 실행할 것이다



D. 코드를 생성하면 DMA 변수가 생성된 것을 확인할 수 있다, 그리고 cube에서 지정한 설정들도 확인이 가능하다

```

/* USER CODE END Includes */

/* Private variables -----
DMA_HandleTypeDef hdma_memtomem_dma2_stream0;

/* USER CODE BEGIN PV */
/* Private variables ----- */

static void MX_DMA_Init(void)
{
    /* DMA controller clock enable */
    __HAL_RCC_DMA2_CLK_ENABLE();

    /* Configure DMA request hdma_memtomem_dma2_stream0 on DMA2_Stream0 */
    hdma_memtomem_dma2_stream0.Instance = DMA2_Stream0;
    hdma_memtomem_dma2_stream0.Init.Channel = DMA_CHANNEL_0;
    hdma_memtomem_dma2_stream0.Init.Direction = DMA_MEMORY_TO_MEMORY;
    hdma_memtomem_dma2_stream0.InitPeriphInc = DMA_PINC_DISABLE;
    hdma_memtomem_dma2_stream0.InitMemInc = DMA_MINC_DISABLE;
    hdma_memtomem_dma2_stream0.InitPeriphDataAlignment = DMA_PDATAALIGN_BYTE;
    hdma_memtomem_dma2_stream0.InitMemDataAlignment = DMA_MDATAALIGN_BYTE;
    hdma_memtomem_dma2_stream0.Init.Mode = DMA_NORMAL;
    hdma_memtomem_dma2_stream0.Init.Priority = DMA_PRIORITY_LOW;
    hdma_memtomem_dma2_stream0.Init.FIFOMode = DMA_FIFOMODE_ENABLE;
    hdma_memtomem_dma2_stream0.Init.FIFOThreshold = DMA_FIFO_THRESHOLD_FULL;
    hdma_memtomem_dma2_stream0.Init.MemBurst = DMA_MBURST_SINGLE;
    hdma_memtomem_dma2_stream0.Init.PeriphBurst = DMA_PBURST_SINGLE;
    if (HAL_DMA_Init(&hdma_memtomem_dma2_stream0) != HAL_OK)
    {
        _Error_Handler(__FILE__, __LINE__);
    }
}

```

- E. 그리고 아웃라인 확인을 통해서 DMA API들을 살펴보도록 한다. Polling에서 사용할 함수들은 2가지가 있다. 하나는 DMA 시작, 나머지 하나는 polling 시스템에서 DMA가 도착지에 도달할 때까지 기다리는 것이다



- F. 그리고 다음과 같이 코드를 작성할 수 있다. 429보드에 있는 PG13, 14에 대한 LED를 제어하려고 한다

```

/* USER CODE BEGIN 0 */
uint16_t led_data[2] = {0xffff, 0x0000};
/* USER CODE END 0 */

/* USER CODE BEGIN WHILE */
while (1)
{
    /* USER CODE END WHILE */

    /* USER CODE BEGIN 3 */
    HAL_DMA_Start(&hdma_memtomem_dma2_stream0, (uint32_t)&led_data[0], (uint32_t)&GPIOG->ODR, 2);
    HAL_DMA_PollForTransfer(&hdma_memtomem_dma2_stream0, HAL_DMA_FULL_TRANSFER, HAL_MAX_DELAY);
    HAL_Delay(500);

    HAL_DMA_Start(&hdma_memtomem_dma2_stream0, (uint32_t)&led_data[1], (uint32_t)&GPIOG->ODR, 2);
    HAL_DMA_PollForTransfer(&hdma_memtomem_dma2_stream0, HAL_DMA_FULL_TRANSFER, HAL_MAX_DELAY);
    HAL_Delay(500);
}
/* USER CODE END 3 */

```

- G. 실수했던 점은 DMA는 한 바이트씩 전달을 한다. 따라서 DMA\_Start 함수 마지막 매개변수인 length을 2라고 명시해야만 13, 14 포트에 데이터가 써질 수 있다. 그리고 DMA가 작성될 때, 데이터가 써질 때 Dst, Src 주소가 자동으로 증가해야만 정상적으로 써질 수 있었다. 따라서 위에서 놓친 자동 increment 설정을 해야만 한다



- H. 그러면 LED가 500ms 주기로 toggle 되는 것을 확인할 수 있다

[동영상]

## 2.2 LED Toggle with Interrupt

- 이전에 polling으로 DMA를 활용해봤다. 조금은 다르지만 거의 비슷한 프로그램 방식으로 인터럽트 방식을 활용하려고 한다

### A. DMA2에 대한 NVIC을 활성화한다



### B. 그리고 이번에는 IT API인 DMA\_Start\_IT를 실행해보도록 할 것이다

```
/* USER CODE BEGIN SysInit */

/* USER CODE END SysInit */

/* Initialize all configured peripherals */
MX_GPIO_Init();
MX_DMA_Init();
/* USER CODE BEGIN 2 */

HAL_DMA_Start_IT(&hdma_memtomem_dma2_stream0, (uint32_t)&led_data[idx], (uint32_t)&GPIOG->ODR, 2);
/* USER CODE END 2 */

/* Infinite loop */
/* USER CODE BEGIN WHILE */
while (1)
{
    /* USER CODE END WHILE */

    /* USER CODE BEGIN 3 */
}
```

C. 디버깅을 실행하면 Handler로 진입하는 것을 알 수 있다

```

197 */
198 void DMA2_Stream0_IRQHandler(void)
199 {
200     /* USER CODE BEGIN DMA2_Stream0_IRQHandler 0 */
201
202     /* USER CODE END DMA2_Stream0_IRQHandler 0 */
203     HAL_DMA_IRQHandler(&hdma_memtomem_dma2_stream0);
204     /* USER CODE BEGIN DMA2_Stream0_IRQHandler 1 */
205
206     /* USER CODE END DMA2_Stream0_IRQHandler 1 */
207 }
208
209 /* USER CODE BEGIN 1 */
210
211 /* USER CODE END 1 */

```

그리고 메모리에 값이 제대로 쓰여지는 것도 확인이 가능하다



D. 하지만 Handler 안에서 정확한 callback이 정해져 있지 않아서 callback 함수가 실행이 되지 않는다. 아래 빨간 박스에 진입이 되지 않는다

```

912     if((hdma->Instance->CR & DMA_SxCR_CIRC) == RESET)
913     {
914         /* Disable the transfer complete interrupt */
915         hdma->Instance->CR  &= ~(DMA_IT_TC);
916
917         /* Process Unlocked */
918         __HAL_UNLOCK(hdma);
919
920         /* Change the DMA state */
921         hdma->State = HAL_DMA_STATE_READY;
922     }
923
924     if(hdma->XferCpltCallback != NULL)
925     {
926         /* Transfer complete callback */
927         hdma->XferCpltCallback(hdma);
928     }
929 }
930 }
931
932 /* manage error case */
933 if(hdma->ErrorCode != HAL_DMA_ERROR_NONE)
934 {
935     if((hdma->ErrorCode & HAL_DMA_ERROR_TE) != RESET)
936     {
937         hdma->State = HAL_DMA_STATE_ABORT;
938
939         /* Disable the stream */
940         __HAL_DMA_DISABLE(hdma);
941
942         do
943

```

## E. 따라서 다음 API를 사용해서 콜백함수를 등록해야 한다

```

/**
 * @brief Register callbacks
 * @param hdma pointer to a DMA_HandleTypeDef structure that contains
 *              the configuration information for the specified DMA Stream.
 * @param CallbackID User Callback identifier
 * @param pCallback a DMA_HandleTypeDef structure as parameter.
 *                  pointer to private callback function which has pointer to
 *                  a DMA_HandleTypeDef structure as parameter.
 * @retval HAL status
 */
HAL_StatusTypeDef HAL_DMA_RegisterCallback(DMA_HandleTypeDef *_hdma, HAL_DMA_CallbackIDTypeDef CallbackID, void (* pCallback)(DMA_HandleTypeDef *_hdma))
{
    HAL_StatusTypeDef status = HAL_OK;

    /* Process locked */
    _HAL_LOCK(hdma);

    if(HAL_DMA_STATE_READY == hdma->State)
    {
        switch (CallbackID)
        {
            case HAL_DMA_XFER_CPLT_CB_ID:
                hdma->xferCpltCallback = pCallback;
                break;

            case HAL_DMA_XFER_HALFCPLT_CB_ID:
                hdma->xferHalfCpltCallback = pCallback;
                break;
        }
    }
}

HAL_DMA_RegisterCallback(&hdma_memtomem_dma2_stream0,
                        HAL_DMA_XFER_CPLT_CB_ID, dma_full_callback);

```

다음과 같이 callback 함수를 만들어서 DMA에 등록을 해주도록 한다. 다음 callback 함수는 모든 전송이 완료되었을 때 이뤄진다

```

04
65 /* USER CODE BEGIN 0 */
66 uint8_t idx;
67 volatile uint8_t dma_flag;
68 uint16_t led_data[2] = {0xffff, 0x0000};
69
70 void dma_full_callback(DMA_HandleTypeDef *_hdma)
71 {
72     dma_flag = 1;
73 }
/* USER CODE END 0 */

116 /* USER CODE BEGIN WHILE */
117 while (1)
118 {
119
120 /* USER CODE END WHILE */
121
122 /* USER CODE BEGIN 3 */
123     if(dma_flag) {
124         HAL_Delay(500);
125         idx = (idx + 1) % 2;
126         HAL_DMA_Start_IT(&hdma_memtomem_dma2_stream0, (uint32_t)&led_data[idx], (uint32_t)&GPIOG->ODR, 2);
127         dma_flag = 0;
128     }
129 }
/* USER CODE END 3 */
130
131 /* USER CODE END 3 */
132
133 }
134

```

## 2.3 DMA를 이용한 SRAM 간 데이터 공유

- DMA를 이용해서 SRAM1과 SRAM2 사이에 데이터를 공유하려고 한다. 먼저 버스 매트릭스를 통해서 어떤 루트로 데이터를 전달할 수 있을지 보려고 한다

Figure 2. System architecture for STM32F42xxx and STM32F43xxx devices



DMA1은 Peripheral간 메모리 공유만 가능한 것을 볼 수 있고, DMA2만 빨간색 경로로 SRAM간 데이터 공유가 가능하다. 따라서 DMA2를 사용하려고 한다. 기존의 스트림을 사용해도 되고, 하나의 스트림을 새로 생성해도 좋다

### A. 새로 스트림을 만들도록 한다



B. 코드를 생성한 이후에 SRAM2의 주소를 확인하도록 한다

**Table 4. Memory mapping vs. Boot mode/physical remap  
in STM32F42xxx and STM32F43xxx**

| Addresses                 | Boot/Remap in main Flash memory | Boot/Remap in embedded SRAM | Boot/Remap in System memory | Remap in FMC   |
|---------------------------|---------------------------------|-----------------------------|-----------------------------|----------------|
| 0x2002 0000 - 0x2002 FFFF | SRAM3 (64 KB)                   | SRAM3 (64 KB)               | SRAM3 (64 KB)               | SRAM3 (64 KB)  |
| 0x2001 C000 - 0x2001 FFFF | SRAM2 (16 KB)                   | SRAM2 (16 KB)               | SRAM2 (16 KB)               | SRAM2 (16 KB)  |
| 0x2000 0000 - 0x2001 BFFF | SRAM1 (112 KB)                  | SRAM1 (112 KB)              | SRAM1 (112 KB)              | SRAM1 (112 KB) |
| 0x1FFF 0000 - 0x1FFF 77FF | System memory                   | System memory               | System memory               | System memory  |
| 0x0810 0000 - 0x0FFF FFFF | Reserved                        | Reserved                    | Reserved                    | Reserved       |
| 0x0800 0000 - 0x081F FFFF | Flash memory                    | Flash memory                | Flash memory                | Flash memory   |

C. 임의로 SRAM2의 주소를 지정한다

```
/* USER CODE BEGIN 0 */

uint16_t dma_data[2] = {0x5678, 0x0000};

/* USER CODE END 0 */
```

D. 데이터와 DMA API로 호출하도록 한다. 이상하게 DMA를 한 후에 코드가 없으면 데이터는 써지는데 while 무한루프로 돌아가지 않는 것을 확인할 수 있다. 그래서 임의의 코드를 작성한다

```
HAL_DMA_Start(&hdma_memtomem_dma2_stream1, (uint32_t)&dma_data[0], (uint32_t)SRAM2_BASE_ADDR, 2);

/* USER CODE END 2 */

/* Infinite loop */
/* USER CODE BEGIN WHILE */
while (1)
{
    /* USER CODE END WHILE */

    /* USER CODE BEGIN 3 */
    HAL_GPIO_WritePin(GPIOG, GPIO_PIN_14, GPIO_PIN_SET);
    HAL_Delay(500);

    HAL_GPIO_WritePin(GPIOG, GPIO_PIN_14, GPIO_PIN_RESET);
    HAL_Delay(500);
}

/* USER CODE END 3 */
```

E. 데이터가 써진 것을 확인할 수 있다. 리틀 엔디안 방식을 따르기 때문에 주소가 낮은 곳이 오른쪽 부분이다



## 2.4 DMA1으로 했을 때의 오류 발생

- DMA1일 때는 버스 매트릭스로도 보았듯이, 페리페럴과 메모리간 DMA만 지원한다

Figure 2. System architecture for STM32F42xxx and STM32F43xxx devices



- 만일 cubemx에서 아무리 peripheral 없이 메모리간 DMA를 하기 위해서 Add를 하면 오류가 발생한다



## 2.5 DMA를 이용한 UART-SRAM 데이터 공유

- 지금은 peripheral에서 memory로 데이터를 전달하려고 한다. Polling은 DMA를 쓰는 의미가 없다. 위에서 한 것은 DMA를 사용하기 위해서 실습을 해본 것이고, 지금부터는 인터럽트로 DMA를 사용하려고 한다
- DMA 요청은 다음과 같이 이뤄질 것이다



- 먼저 PC에서 UART로 데이터를 보내면 UART는 이를 데이터 레지스터에 저장한다
- 그리고 처음에 DMA1에 stream과 채널 개방을 요구한다. 열린다면 그 이후에 해당 stream으로 SRAM에 데이터를 저장할 수 있게 된다
- 그리고 config에서 설정한 데이터 바이트가 모두 전달되면 DMA는 ARM에게 handler 요청을하게 되어서, 이때 ARM이 처리를 하게 되는 것이다. 마지막으로 callback 함수를 호출하게 된다



- A. Cubemx를 열어서 USART1을 비동기로 설정하고, DMA 셋팅을 하도록 한다. 페리페럴이기 때문에 채널과 스트림이 정해져 있다



빨간색 영역은 RX DR은 주소가 이미 정해져있는 1바이트 버퍼이고, 저장하려는 SRAM 영역은 연속적으로 증가해야 한다. 따라서 Memory 쪽만 Increment 하기로 한다

Figure 296. USART block diagram



B. 그리고 코드를 작성하도록 한다. UART를 DMA로 받으려고 하는 것이다. 다음 API를 사용하도록 한다

```
HAL_UART_Receive_DMA(&huart1, (uint8_t*)(SRAM_ADDR), 10);
/* USER CODE END 2 */
```

함수 안은 다음과 같이 작성되어 있다. Half, full 2가지 callback을 제공하고 있고, 디버깅 결과 모든 콜백이 호출된다는 것이 확인되었다

```
/* Set the UART DMA transfer complete callback */
huart->hdmarx->XferCpltCallback = UART_DMAReceiveCplt;

/* Set the UART DMA Half transfer complete callback */
huart->hdmarx->XferHalfCpltCallback = UART_DMARxHalfCplt;

/* Set the DMA error callback */
huart->hdmarx->XferErrorCallback = UART_DMAError;

/* Set the DMA abort callback */
huart->hdmarx->XferAbortCallback = NULL;

/* Enable the DMA Stream */
tmp = (uint32_t*)&pData;
HAL_DMA_Start_IT(huart->hdmarx, (uint32_t)&huart->Instance->DR, *(uint32_t*)tmp, Size);
```

### C. Breakpoint를 몇 개 잡고나서 코드를 디버깅 해보도록 한다



먼저 총 5바이트를 입력하면 DMA가 ARM을 호출한다. 이유는 half 조건에서 걸렸기 때문이다. 그래서 다음으로 아래 2개의 함수를 지나가게 된다

```

059     * @brief This Function handles DMA2 stream global interrupt.
060
061     void DMA2_Stream0_IRQHandler(void)
062     {
063         /* USER CODE BEGIN DMA2_Stream0_IRQn 0 */
064
065         HAL_UART_RxHalfCpltCallback(huart);
066
067     /* USER CODE END DMA2_Stream0_IRQn 1 */
068
069     /* USER CODE BEGIN 1 */
070
071     /* USER CODE END 1 */
072
073     /* *****END OF FILE***** */
074
075 }

```

#### D. 다시 재개 후 나머지 5바이트를 입력하도록 한다

```

DMA2_Stream2_IRQHandler() at stm32f4xx_it.c:203 0x8000862
<signal handler called>() at 0xfffffff9
HAL_Delay() at stm32f4xx_hal.c:404 0x8000976
main() at main.c:124 0x80006f6

main.c stm32f4xx_hal_uart.c stm32f4xx_it.c stm32f4xx_hal_dma.c stm32f4xx_hal_dma.h
190 /* Add here the Interrupt Handlers for the used peripherals.
191 /* For the available peripheral interrupt handler names,
192 /* please refer to the startup file (startup_stm32f4xx.s).
193 *****/
194
195 /**
196 * @brief This function handles DMA2 stream2 global interrupt.
197 */
198 void DMA2_Stream2_IRQHandler(void)
199 {
200     /* USER CODE BEGIN DMA2_Stream2_IRQHandler 0 */
201
202     /* USER CODE END DMA2_Stream2_IRQHandler 0 */
203     HAL_DMA_IRQHandler(&hdma_usart1_rx);
204     /* USER CODE BEGIN DMA2_Stream2_IRQHandler 1 */
205
206     /* USER CODE END DMA2_Stream2_IRQHandler 1 */
207 }
208
209 /* USER CODE BEGIN 1 */
210
211 /* USER CODE END 1 */
212 ****/ (C) COPYRIGHT STMicroelectronics *****END OF FILE****/
213

```

Console Tasks Problems Executables Debugger Console Memory

7.dma\_uart\_to\_sram Debug [Acc STM32 Debugging] openocd

Info : STM32F429ZITx.cpu: hardware has 6 breakpoints, 4 watchpoints

Info : Listening on port 3333 for gdb connections

Info : accepting 'gdb' connection on tcp/3333

그리고 최종적으로 rxcompletecallback 함수에 걸리게 된다

```

/* USER CODE BEGIN 0 */
void HAL_UART_RxCpltCallback(UART_HandleTypeDef *huart)
{
    /* Prevent unused argument(s) compilation warning */
    UNUSED(huart);
    /* NOTE: This function Should not be modified, when the callback is needed,
       the HAL_UART_TxCpltCallback could be implemented in the user file
    */
}

```

Callback 함수에서 DMA를 재호출함으로써 계속 반복할 수 있게 된다

```

/* USER CODE BEGIN 0 */
void HAL_UART_RxCpltCallback(UART_HandleTypeDef *huart)
{
    /* Prevent unused argument(s) compilation warning */

    /* NOTE: This function Should not be modified, when the callback is needed,
       the HAL_UART_TxCpltCallback could be implemented in the user file
    */
    HAL_UART_Receive_DMA(&huart1, (uint8_t*)(SRAM_ADDR), 10);
}

```

E. 다음은 쓰여진 helloworld라는 문자열이 SRAM에 저장된 것을 나타낸 사진이다



참고사항: teraterm echo 설정



### 3. DMA 고급 개념

- 지금까지 DMA 기본 개념을 공부하고, M2M, P2M을 폴링, 인터럽트 방식으로 제어해봤다. 더 나아가서 DMA 세팅에서 나타난 용어들에 대해서 서술해보려고 한다
- DMA는 AHB Master 모듈이면서 Stm32f429에는 2개가 존재하고 있다

Figure 32. DMA block diagram



#### 3.1 DMA Slave Port

Figure 32. DMA block diagram



- DMA Slave Port는 source, destination 주소 설정 등 config를 위해서 있는 port다. 통신을 하진 않는다는 점을 유의해야 한다

**The AHB slave port is used to program the DMA controller (it supports only 32-bit accesses).**

### 3.2 DMA peripheral and memory port

Figure 32. DMA block diagram



- 메모리, peripheral을 구분 지었는데, 메모리는 SRAM을 peripheral은 APB에 있는 여러 주변장치를 일컫는다
- 그래서 만일 UART Rx 데이터를 SRAM으로 DMA로 전달하려고 하면 다음과 같이 경로가 전달되게 된다

Figure 32. DMA block diagram



### 3.3 DMA Stream

- Block 디어그램에서도 확인할 수 있듯이, 각각의 포트들은 단일 방향을 가지고 있지 않고 양방향 DMA를 할 수 있다는 것이다. 즉
  - Memory to Peripheral
  - Peripheral to Memory
  - Memory to Memory

The DMA controller performs direct memory transfer: as an AHB master, it can take the control of the AHB bus matrix to initiate AHB transactions.

It can carry out the following transactions:

- peripheral-to-memory
- memory-to-peripheral
- memory-to-memory

The DMA controller provides two AHB master ports: the *AHB memory port*, intended to be connected to memories and the *AHB peripheral port*, intended to be connected to peripherals. However, to allow memory-to-memory transfers, the *AHB peripheral port* must also have access to the memories.

Figure 32. DMA block diagram



- 그러면 M2M은 어떻게 하는 것일까? 결론적으로는 DMA1은 할 수 없지만, DMA2는 할 수 있다. Peripheral 포트를 Memory가 사용할 수 있게 길을 제공하고 있다

Figure 2. System architecture for STM32F42xxx and STM32F43xxx devices



Does the memory that starts from M2M have to start from the peripheral port Necessarily?

Figure 34. System implementation of the two DMA controllers (STM32F42xxx and STM32F43xxx)



Figure 4. STM32F427xx and STM32F429xx block diagram



참고) AHB/APB2는 DMA2, 그리고 AHB/APB1은 DMA1에 연결되어 있다. 그리고 AHB1 Peripheral은 따로 있고 이는 DMA2에 연결되어 있다

### 3.4 DMA Channel

- 각각의 stream들은 8개의 DMA request와 연결되어 있다. 각 request들은 다양한 peripheral로 연결되어 있다

**Figure 35. Channel selection**



The 8 requests from the peripherals (TIM, ADC, SPI, I2C, etc.) are independently connected to each channel and their connection depends on the product implementation.

- 예를 들어 DMA2에 대한 request mapping이다. **SRAM, Flash와 같은 memory 디바이스는 정해진 stream 번호가 없다**

**Table 43. DMA2 request mapping**

| Peripheral requests | Stream 0               | Stream 1               | Stream 2                         | Stream 3               | Stream 4                          | Stream 5               | Stream 6                         | Stream 7                          |
|---------------------|------------------------|------------------------|----------------------------------|------------------------|-----------------------------------|------------------------|----------------------------------|-----------------------------------|
| Channel 0           | ADC1                   | SAI1_A <sup>(1)</sup>  | TIM8_CH1<br>TIM8_CH2<br>TIM8_CH3 | SAI1_A <sup>(1)</sup>  | ADC1                              | SAI1_B <sup>(1)</sup>  | TIM1_CH1<br>TIM1_CH2<br>TIM1_CH3 | -                                 |
| Channel 1           | -                      | DCMI                   | ADC2                             | ADC2                   | SAI1_B <sup>(1)</sup>             | SPI6_TX <sup>(1)</sup> | SPI6_RX <sup>(1)</sup>           | DCMI                              |
| Channel 2           | ADC3                   | ADC3                   | -                                | SPI5_RX <sup>(1)</sup> | SPI5_TX <sup>(1)</sup>            | CRYP_OUT               | CRYP_IN                          | HASH_IN                           |
| Channel 3           | SPI1_RX                | -                      | SPI1_RX                          | SPI1_TX                | -                                 | SPI1_TX                | -                                | -                                 |
| Channel 4           | SPI4_RX <sup>(1)</sup> | SPI4_TX <sup>(1)</sup> | USART1_RX                        | SDIO                   | -                                 | USART1_RX              | SDIO                             | USART1_TX                         |
| Channel 5           | -                      | USART6_RX              | USART6_RX                        | SPI4_RX <sup>(1)</sup> | SPI4_TX <sup>(1)</sup>            | -                      | USART6_TX                        | USART6_TX                         |
| Channel 6           | TIM1_TRIG              | TIM1_CH1               | TIM1_CH2                         | TIM1_CH1               | TIM1_CH4<br>TIM1_TRIG<br>TIM1_COM | TIM1_UP                | TIM1_CH3                         | -                                 |
| Channel 7           | -                      | TIM8_UP                | TIM8_CH1                         | TIM8_CH2               | TIM8_CH3                          | SPI5_RX <sup>(1)</sup> | SPI5_TX <sup>(1)</sup>           | TIM8_CH4<br>TIM8_TRIG<br>TIM8_COM |

1. These requests are available on STM32F42xxx and STM32F43xxx.

- 전체 stream에 대한 request map이다

Figure 32. DMA block diagram



- 그리고 하나의 Peripheral은 하나의 stream으로만 연결되어 있는 것은 아니다

Table 42. DMA1 request mapping

| Peripheral requests | Stream 0                | Stream 1                | Stream 2            | Stream 3                | Stream 4              | Stream 5    | Stream 6                | Stream 7            |
|---------------------|-------------------------|-------------------------|---------------------|-------------------------|-----------------------|-------------|-------------------------|---------------------|
| Channel 0           | SPI3_RX                 | -                       | SPI3_RX             | SPI2_RX                 | SPI2_TX               | SPI3_TX     | -                       | SPI3_TX             |
| Channel 1           | I2C1_RX                 | -                       | TIM7_UP             | -                       | TIM7_UP               | I2C1_RX     | I2C1_TX                 | I2C1_TX             |
| Channel 2           | TIM4_CH1                | -                       | I2S3_EXT_RX         | TIM4_CH2                | I2S2_EXT_TX           | I2S3_EXT_TX | TIM4_UP                 | TIM4_CH3            |
| Channel 3           | I2S3_EXT_RX             | TIM2_UP<br>TIM2_CH3     | I2C3_RX             | I2S2_EXT_RX             | I2C3_TX               | TIM2_CH1    | TIM2_CH2<br>TIM2_CH4    | TIM2_UP<br>TIM2_CH4 |
| Channel 4           | UART5_RX                | USART3_RX               | UART4_RX            | USART3_TX               | UART4_TX              | USART2_RX   | USART2_TX               | UART5_TX            |
| Channel 5           | UART8_TX <sup>(1)</sup> | UART7_TX <sup>(1)</sup> | TIM3_CH4<br>TIM3_UP | UART7_RX <sup>(1)</sup> | TIM3_CH1<br>TIM3_TRIG | TIM3_CH2    | UART8_RX <sup>(1)</sup> | TIM3_CH3            |

DMA Channel Mapping은 다음과 같이 한다

### 1) P2M

Figure 32. DMA block diagram



만약에 Peripheral이 DMA에게 STREAM request를 보내면 Arbiter는 해당 스트림을 열어 주게 된다

### 2) M2M

Arbiter쪽을 사용할 필요가 없고 M2M은 아무 Stream을 사용하면 된다

Figure 32. DMA block diagram



3) M2P

M2P 또한 결국엔 Peripheral로 전달하는 것이기 때문에 반드시 stream과 채널을 정해져서 내보내야 한다

Figure 32. DMA block diagram



## 4. DMA 실습

- ADC에 읽은 데이터를 SRAM에 작성하는 P2M 실습을 해보려고 한다. ADC는 변환을 완료하면 DMA에게 Request를 알리고, SRAM에 저장하게 된다



- ADC 대상은 MCU 안에 있는 온도 센서를 활용하려고 한다

Figure 63. Temperature sensor and  $V_{REFINT}$  channel block diagram



1.  $V_{SENSE}$  is input to ADC1\_IN16 for the STM32F40x and STM32F41x devices and to ADC1\_IN18 for the STM32F42x and STM32F43x devices.

## 4.1 CubeMX 설정

- ADC1에 있는 온도센서를 입력으로 받도록 한다



- 그리고 12bit resolution에 scan, continuous 설정까지 마치도록 한다. 그리고 16개의 Rank를 활용해서 sampling 하도록 한다. 즉 모든 채널을 온도 센서 sampling으로 활용하겠다는 것이다



- 그리고 DMA로 설정하는데, P2M이기 때문에 Peripheral에 맞는 스트림과 채널이 정해져 있다



- 그리고 Memory에만 Increment가 되어있는 이유는 ADC 데이터 레지스터는 정해져 있고, SRAM은 그 값을 저장하기 위해서 자동적으로 증가해야 한다
- 그리고 12비트 온도 센서 값이기 때문에 data는 2byte = word로 설정했다

- 자동적으로 DMA NVIC이 설정된 것을 확인할 수 있다



- 추가로 버튼을 눌렀을 때 ADC 연산을 시작하기 위해서 버튼 인터럽트도 추가하도록 한다



## 4.2 프로그램 코드 작성

- HAL\_ADC 드라이버 소스로 가면 다음과 같이 DMA Start 함수가 있다. 이를 버튼 인터럽트에 넣어서 버튼이 눌렸을 때마다 실행하도록 한다

```

191 // Includes -----
192 #include "stm32f4xx_hal.h"
193 #include "stm32f4xx_hal_adc.h"
194
195 /** @defgroup STM32F4xx_HAL_Driver
196 * @{
197 */
198
199 /** @defgroup ADC ADC
200 * @{
201 */
202 */
203
204 #ifndef HAL_ADC_MODULE_ENABLED
205
206 /* Private typedef -----*/
207 /* Private define -----*/
208 /* Private macro -----*/
209 /* Private variables -----*/
210 /** @defgroup ADC_Private_Functions
211 * @{
212 */
213 /* Private function prototypes -----*/
214 static void ADC_Init(ADC_HandleTypeDef* hadc);
215 static void ADC_DMAConvCplt(ADC_HandleTypeDef* hdma);
216 static void ADC_DMAError(ADC_HandleTypeDef* hdma);
217 static void ADC_DMAMhalfConvCplt(ADC_HandleTypeDef* hdma);
218 /**
219 */
220 /**
221 /* Exported functions -----*/
222 /** @defgroup ADC_Exported_Functions ADC Exported Functions
223 * @{
224 */
225
226 /** @defgroup ADC_Exported_Functions_Group1 Initialization and de-initialization functions
227 * @brief Initialization and Configuration functions
228 */

```

  

```

/* USER CODE BEGIN 0 */
uint16_t temp_data[16];

void HAL_GPIO_EXTI_Callback(uint16_t GPIO_Pin)
{
    HAL_ADC_Start_DMA(&hadc1, (uint32_t*)temp_data, 16);
}

void HAL_ADC_ConvCpltCallback(ADC_HandleTypeDef* hadc)
{
}
/* USER CODE END 0 */

```

temp\_data는 전역 변수로 런타임 때 SRAM에 위치한다. 그리고 DMA가 완료되면 HAL\_ADC\_ConvCpltCallback 함수가 불린다. 자세한 내용은 Start\_DMA 함수에 적혀 있다

```

/* Set the DMA transfer complete callback */
hadc->DMA_Handle->XferCpltCallback = ADC_DMAMhalfConvCplt;

/* Set the DMA half transfer complete callback */
hadc->DMA_Handle->XferHalfCpltCallback = ADC_DMAMhalfConvCplt;
|
/* Set the DMA error callback */
hadc->DMA_Handle->XferErrorCallback = ADC_DMAError;

```

- 디버깅 시 버튼을 눌렀을 때 값이 잘 들어간 것을 확인할 수 있다. 총 2바이트로 32바이트가 순차적으로 쓰여지는 것을 볼 수 있다



- 받은 값을 가지고 온도 계산을 해보도록 하자

#### 8. Calculate the temperature using the following formula:

$$\text{Temperature (in } ^\circ\text{C)} = \{(V_{\text{SENSE}} - V_{25}) / \text{Avg\_Slope}\} + 25$$

Where:

- $V_{25}$  =  $V_{\text{SENSE}}$  value for  $25^\circ \text{C}$
- Avg\_Slope = average slope of the temperature vs.  $V_{\text{SENSE}}$  curve (given in  $\text{mV}/^\circ\text{C}$  or  $\mu\text{V}/^\circ\text{C}$ )

Refer to the datasheet's electrical characteristics section for the actual values of  $V_{25}$  and Avg\_Slope.

#### 6.3.22 Temperature sensor characteristics

Table 80. Temperature sensor characteristics

| Symbol                     | Parameter                                                                    | Min | Typ     | Max     | Unit                       |
|----------------------------|------------------------------------------------------------------------------|-----|---------|---------|----------------------------|
| $T_L^{(1)}$                | $V_{\text{SENSE}}$ linearity with temperature                                | -   | $\pm 1$ | $\pm 2$ | $^\circ\text{C}$           |
| Avg_Slope <sup>(1)</sup>   | Average slope                                                                | -   | 2.5     |         | $\text{mV}/^\circ\text{C}$ |
| $V_{25}^{(1)}$             | Voltage at $25^\circ \text{C}$                                               | -   | 0.76    |         | V                          |
| $t_{\text{START}}^{(2)}$   | Startup time                                                                 | -   | 6       | 10      | $\mu\text{s}$              |
| $T_{\text{S\_temp}}^{(2)}$ | ADC sampling time when reading the temperature (1 $^\circ\text{C}$ accuracy) | 10  | -       | -       | $\mu\text{s}$              |

1. Guaranteed by characterization results.

2. Guaranteed by design.

- 총 12비트이고, VDD=Vref는 3.3V다. 그리고 측정값 중 하나는 1074이다. 이를 계산하면 25.x값이 나온다



- 그래서 다음과 같이 코드를 작성할 수 있다

```

/* Infinite loop */
/* USER CODE BEGIN WHILE */
while (1)
{
    /* USER CODE END WHILE */

    /* USER CODE BEGIN 3 */
    __disable_irq();
    if(dma_finish) {
        dma_finish = 0;
        __enable_irq();

        float temp_sum = 0;
        for(int i=0; i<12; i++) {
            temp_sum += temp_data[i];
        }
        temp_sum = temp_sum / 12.0;

        float temp = (((temp_sum * (3.3/(2^12)-1))-0.76)/2.5)+.25;
        // print(temp);
    }

    __WFI();
} /* USER CODE END 3 */

```

- Float 연산이 들어가 있어서 FPU가 없이는 부담되는 연산이다. 값이 나오는지 확인해보도록 한다

## 5. DMA 고급 개념

### 5.1 Arbiter

- 하나의 DMA는 동시에 여러 stream을 다룰 수 없다. 따라서 Arbiter는 스트림 개방에 있어서 중재해주는 역할을 한다. 동시에 요청이 들어왔을 때는 우선순위에 따라서 결정하게 된다. 소프트웨어 → 하드웨어 순으로 우선순위를 나누게 된다

Figure 32. DMA block diagram



#### 10.3.4 Arbiter

An arbiter manages the 8 DMA stream requests based on their priority for each of the two AHB master ports (memory and peripheral ports) and launches the peripheral/memory access sequences.

Priorities are managed in two stages:

- Software: each stream priority can be configured in the DMA\_SxCR register. There are four levels:
  - Very high priority
  - High priority
  - Medium priority
  - Low priority
- Hardware: If two requests have the same software priority level, the stream with the lower number takes priority over the stream with the higher number. For example, Stream 2 takes priority over Stream 4.

- CubeMX에서는 다음과 같이 소프트웨어적으로 Priority를 지정할 수 있다



- 그리고 하드웨어적으로는 stream 번호가 낮은 것이 우선순위를 갖게 된다

## 5.2 Fifo

- FIFO는 일종의 버퍼로 First in first out의 규칙으로 동작하는 메모리다. 각 stream은 독립적인 4word(총 16바이트)를 가지고 있다. FIFO 모드를 설정하지 않으면 기본적으로 Direct mode로 동작한다

Figure 36. Peripheral-to-memory mode



Figure 39. FIFO structure



ai15951

- 그리고 threshold 값이 있어서, 1/4, half, 3/4, full로 각각 FIFO가 채워졌을 때 destination으로 가게끔 설정할 수 있다
- 그리고 burst는 한 번에 보낼 수 있는 데이터 양을 결정하는 것이다. 예를 들어 INCR4로 설정하면 한 번에 4바이트(1word)가 전달된다는 것을 확인할 수 있다

Table 48. FIFO threshold configurations

| MSIZE     | FIFO level | MBURST = INCR4      | MBURST = INCR8      | MBURST = INCR16     |
|-----------|------------|---------------------|---------------------|---------------------|
| Byte      | 1/4        | 1 burst of 4 beats  | forbidden           | forbidden           |
|           | 1/2        | 2 bursts of 4 beats | 1 burst of 8 beats  |                     |
|           | 3/4        | 3 bursts of 4 beats | forbidden           |                     |
|           | Full       | 4 bursts of 4 beats | 2 bursts of 8 beats | 1 burst of 16 beats |
| Half-word | 1/4        | forbidden           | forbidden           | forbidden           |
|           | 1/2        | 1 burst of 4 beats  |                     |                     |
|           | 3/4        | forbidden           |                     |                     |
|           | Full       | 2 bursts of 4 beats | 1 burst of 8 beats  |                     |
| Word      | 1/4        | forbidden           | forbidden           | forbidden           |
|           | 1/2        |                     |                     |                     |
|           | 3/4        |                     |                     |                     |
|           | Full       | 1 burst of 4 beats  |                     |                     |

- OUTPUT 결과가 달라지지 않지만, FIFO가 채워지기 전까지 DMA 요청이 없기 때문에 보다 더 pending 횟수를 줄일 수 있고, 이로 인해 다른 stream이 DMA 컨트롤러를 더 많이 이용할 수 있다는 점이 장점이다

## 6. OV2640 카메라 모듈 제어

- Omnipixel 회사의 카메라 모듈인 OV2640 을 제어해보려고 한다. 카메라 이미지를 DMA 컨트롤러를 이용해서 제어해보려고 한다
- 제품의 사진은 아래와 같다



**Omnivision**

**Advanced Information  
Preliminary Datasheet**

### OV2640 Color CMOS UXGA (2.0 MegaPixel) CAMERACHIP™ with OmniPixel2™ Technology

#### General Description

The OV2640 CAMERACHIP™ is a low voltage CMOS image sensor that provides the full functionality of a single-chip UXGA (1632x1232) camera and image processor in a small footprint package. The OV2640 provides full-frame, sub-sampled, scaled or windowed 8-bit/10-bit images in a wide range of formats, controlled through the Serial Camera Control Bus (SCCB) interface.

This product has an image array capable of operating at up to 15 frames per second (fps) in UXGA resolution with complete user control over image quality, formatting and output data transfer. All required image processing functions, including exposure control, gamma, white balance, color saturation, hue control, white pixel canceling, noise canceling, and more, are also programmable through the SCCB interface. The OV2640 also includes a compression engine for increased processing power. In addition, Omnipixel CAMERACHIPS use proprietary sensor technology to improve image quality by reducing or eliminating common lighting/electrical sources of image contamination, such as fixed pattern noise, smearing, etc., to produce a clean, fully stable color image.



**Note:** The OV2640 uses a lead-free package.

#### Applications

- Cellular and Camera Phones
- Toys
- PC Multimedia
- Digital Still Cameras

#### Key Specifications

|                        |                 |                                           |             |
|------------------------|-----------------|-------------------------------------------|-------------|
| Power Supply           | Array Size      | UXGA                                      | 1600 x 1200 |
|                        | Core            | 1.2VDC ± 5%                               |             |
|                        | Analog          | 2.5 ~ 3.0VDC                              |             |
|                        | I/O             | 1.7V to 3.3V                              |             |
| Power Requirements     | Active          | 125 mW (for 15 fps, UXGA YUV mode)        |             |
|                        |                 | 140 mW (for 15 fps, UXGA compressed mode) |             |
|                        | Standby         | 600 µA                                    |             |
| Temperature Range      | Operation       | -30°C to 70°C                             |             |
|                        | Stable Image    | 0°C to 50°C                               |             |
| Output Formats (8-bit) | Lens Size       | 1/4"                                      |             |
|                        | Chief Ray Angle | 25° non-linear                            |             |
| Maximum Image          | UXGA/SXGA       | 15 fps                                    |             |
|                        | SVGA            | 30 fps                                    |             |

- OV2640 는 CMOS 이미지 센서를 사용했으며, 200 만 화소, 8/10bit 의 해상도를 가지고 있다. 최대 15 프레임까지 나오는 것으로 확인된다
- 그리고 SCCB(Serial Camera Control Bus Interface)를 통해서 데이터가 전달된다. SCCB 는 표준 카메라 통신 규격으로, I2C 와 크게 다르지 않아 I2C 로 쉽게 제어가 가능하다. (I2C ACK 신호를 소프트웨어적으로 비활성화를 하면 가능하다)
- 전송받은 데이터는 STM32 보드의 DCMI 로 받으며, 내부 메모리인 SRAM이나 플래시 메모리에 저장하게 된다

**Figure 73. Top-level block diagram**



- 그리고 DCMI에 대한 레퍼런스 문서 내용이다. 8 - 14bit 병렬 데이터 전달을 지원하며, 최대 54MHz 속도로 54Mbyte/s 까지 데이터 전달을 지원하게 된다. 한 클럭 당 하나의 바이트를 보내는 속도다

### 3.35 Digital camera interface (DCMI)

The devices embed a camera interface that can connect with camera modules and CMOS sensors through an 8-bit to 14-bit parallel interface, to receive video data. The camera interface can sustain a data transfer rate up to 54 Mbyte/s at 54 MHz. It features:

- Programmable polarity for the input pixel clock and synchronization signals
- Parallel data communication can be 8-, 10-, 12- or 14-bit
- Supports 8-bit progressive video monochrome or raw bayer format, YCbCr 4:2:2 progressive video, RGB 565 progressive video or compressed data (like JPEG)
- Supports continuous mode or snapshot (a single frame) mode
- Capability to automatically crop the image

다음은 지원되는 데이터 포맷이다

## 15.2 DCMI main features

- 8-, 10-, 12- or 14-bit parallel interface
- Embedded/external line and frame synchronization
- Continuous or snapshot mode
- Crop feature
- Supports the following data formats:
  - 8/10/12/14- bit progressive video: either monochrome or raw bayer
  - YCbCr 4:2:2 progressive video
  - RGB 565 progressive video
  - Compressed data: JPEG

OV2640은 YCbCr422, RGB565를 지원한다

### General Description

The OV2640 CAMERACHIP™ is a low voltage CMOS image sensor that provides the full functionality of a single-chip UXGA (1632x1232) camera and image processor in a small footprint package. The OV2640 provides full-frame, sub-sampled, scaled or windowed 8-bit/10-bit images in a wide range of formats, controlled through the Serial Camera Control Bus (SCCB) interface.

This product has an image array capable of operating at up to 15 frames per second (fps) in UXGA resolution with complete user control over image quality, formatting and output data transfer. All required image processing functions, including exposure control, gamma, white balance, color saturation, hue control, white pixel canceling, noise canceling, and more, are also programmable through the SCCB interface. The OV2640 also includes a compression engine for increased processing power. In addition, OmniVision CAMERACHIPS use proprietary sensor technology to improve image quality by reducing or eliminating common lighting/electrical sources of image contamination, such as fixed pattern noise, smearing, etc., to produce a clean, fully stable color image.



**Note:** The OV2640 uses a lead-free package.

### Features

### Applications

- Cellular and Camera Phones
- Toys
- PC Multimedia
- Digital Still Cameras

### Key Specifications

|                             |                |                                                                                                |
|-----------------------------|----------------|------------------------------------------------------------------------------------------------|
| Array Size                  | UXGA           | 1600 x 1200                                                                                    |
| Power Supply                | Core           | 1.2VDC ± 5%                                                                                    |
|                             | Analog         | 2.5 ~ 3.0VDC                                                                                   |
|                             | I/O            | 1.7V to 3.3V                                                                                   |
| Power Requirements          | Active         | 125 mW (for 15 fps, UXGA YUV mode)<br>140 mW (for 15 fps, UXGA compressed mode)                |
|                             | Standby        | 600 µA                                                                                         |
| Temperature Range           | Operation      | -30°C to 70°C                                                                                  |
|                             | Stable Image   | 0°C to 50°C                                                                                    |
| Output Formats (8-bit)      |                | • YUV(422/420)/YCbCr422<br>• RGB565/555<br>• 8-bit compressed data<br>• 8-/10-bit Raw RGB data |
| Lens Size                   | 1/4"           |                                                                                                |
| Chief Ray Angle             | 25° non-linear |                                                                                                |
| Maximum Image Transfer Rate | UXGA/SXGA      | 15 fps                                                                                         |
|                             | SVGA           | 30 fps                                                                                         |
|                             | CIF            | 60 fps                                                                                         |

MCU와 카메라 모듈은 다음 인터페이스 구조를 가지고 있다

Figure 5. Interfacing a camera module with an MCU



자세하게 OV2640에 대한 블록 다이어그램은 다음과 같다

Figure 2 shows the functional block diagram of the OV2640 image sensor. The OV2640 includes:

- Image Sensor Array (1632 x 1232 total image array)
- Analog Signal Processor
- 10-Bit A/D Converters
- Digital Signal Processor (DSP)
- Output Formatter
- Compression Engine
- Microcontroller
- SCCB Interface
- Digital Video Port

Figure 2 Functional Block Diagram



그리고 이미지 센서 array에 대한 정보다. 하나의 이미지당 1632 x 1232 픽셀을 가지며, VGA 출력에서와 비슷하게 active line(1,991,040/1632x1220)에 주목할 필요가 있다. 이를 제외한 다른 데이터들은 dummy 혹은 option black 데이터를 가지고 있다. 그리고 Color 필터는 주로 사용되는 bayer 패턴으로 이뤄졌다

다른 자세한 내용은 데이터 시트를 통해서 간략하게 확인할 수 있다

## Image Sensor Array

The OV2640 sensor has an image array of 1632 columns by 1232 rows (2,010,624 pixels). [Figure 3](#) shows a cross-section of the image sensor array.

**Figure 3 Sensor Array Region Color Filter Layout**



The color filters are arranged in a Bayer pattern. The primary color BG/GR array is arranged in line-alternating fashion. Of the 2,010,624 pixels, 1,991,040 (1632x1220) are active. The other pixels are used for black level calibration and interpolation.

The sensor array design is based on a field integration read-out system with line-by-line transfer and an electronic shutter with a synchronous pixel read-out scheme.

\* 참고 (FSMC, FMC)

FSMC는 임베디드 외부 메모리 컨트롤러로써 SRAM, NOR Flash, NAND Flash, LCD 모듈을 MCU와 인터페이스해서 외부 메모리 칩들을 제어할 수 있는 장치다. FSMC의 NOR Flash, SRAM bank는 MCU의 parallel color lcd와 같이 사용할 수 있다. HCLK 클럭을 공급받고, FMC 인터럽트를 발생시킬 수 있고, 데이터버스는 32비트다

현재는 stm32f429-discovery 보드에 있는 SDRAM을 컨트롤하기 위해서 SDRAM 위주로 설명하려고 한다. 데이터버스는 8, 16, 32비트 단위로 접근 가능하며, 내부 뱅크는 최대 4개로 이뤄져 있다

**Figure 456. FMC block diagram**



- SDCLK: SDRAM Clock
- SDNWE: Write Enable
- SDCKE[1:0]: Bank N clock enable
- SDNE[1:0]: Bank N chip enable
- NRAS: Row Address Strobe
- NCAS: Column Address Strobe

Figure 457. FMC memory banks



각 뱅크 사이즈는  $0x10000000 = 4 \times 64\text{MB}$ 로 상위 2비트가 내부 뱅크 주소를 의미한다. 따라서 내부 뱅크 하나 당 64MB의 메모리 영역을 사용할 수 있다

다음 레지스터 비트로 외부 뱅크를 먼저 선정할 수 있다

### 37.4.3 SDRAM address mapping

The HADDR[28] bit (internal AHB address line 28) is used to select one of the two memory banks as indicated in [Table 258](#).

Table 258. SDRAM bank selection

| HADDR[28] | Selected bank | Control register | Timing register |
|-----------|---------------|------------------|-----------------|
| 0         | SDRAM Bank1   | FMC_SDCR1        | FMC_SDTR1       |
| 1         | SDRAM Bank2   | FMC_SDCR2        | FMC_SDTR2       |

그리고 memory width에 따라서 내부 뱅크에 대한 레지스터와 그에 따라서 Row, Column 주소가 달라진다

The following table shows SDRAM mapping for an 13-bit row ,a 11-bit column and 4 internal bank configurations.

Table 259. SDRAM address mapping

| Memory width <sup>(1)</sup> | Internal bank | Row address  | Column address <sup>(2)</sup> | Maximum memory capacity (Mbyte) |
|-----------------------------|---------------|--------------|-------------------------------|---------------------------------|
| 8-bit                       | HADDR[25:24]  | HADDR[23:11] | HADDR[10:0]                   | 64 Mbyte:<br>4 x 8K x 2K        |
| 16-bit                      | HADDR[26:25]  | HADDR[24:12] | HADDR[11:1]                   | 128 Mbyte:<br>4 x 8K x 2K x 2   |
| 32-bit                      | HADDR[27:26]  | HADDR[25:13] | HADDR[12:2]                   | 256 Mbyte:<br>4 x 8K x 2K x 4   |

가장 중요한 것은 사용하고자 하는 SDRAM이 어떤 구조를 가지고 있는지 확인하는 것이다. 현재 SDRAM과 다른 row, col 사이즈를 가지고 config를 하면 동작을 하지 않을 것이다. 다음 [링크](#)로 가면 stm32f429-disc1에 대한 SDRAM 정보를 알 수 있다

## 6.10 64-Mbit SDRAM (1Mbit x 16-bit x 4-bank)

The 64-Mbit SDRAM is a high-speed CMOS, dynamic random-access memory designed to operate in 3.3 V memory systems containing 67,108,864 bits. It is internally configured as a quad-bank DRAM with a synchronous interface. Each 16,777,216-bit bank is organized as 4,096 rows by 256 columns by 16 bits. The 64-Mbit SDRAM includes auto-refresh, power-saving, and power-down modes. All signals are registered on the positive edge of the clock signal, CLK.

The STM32F429ZIT6 reads and writes data at 80 MHz.

SDRAM은 총 64M이며, 내부에 4bank와 각 bank는 1M의 크기를 가지게 된다. 그리고 12 길이의 row, 8 길이의 col, memory width는 16bit가 된다. 데이터시트에 따르면 다음 표를 가지게 될 것이다

Table 261. SDRAM address mapping with 16-bit data bus width<sup>(1)(2)</sup>

| Row size Configuration        | HADDR(AHB address Lines) |               |    |            |    |           |    |    |    |    |    |    |    |    |    |    |    |    |              |             |   |   |     |                    |   |   |   |   |  |
|-------------------------------|--------------------------|---------------|----|------------|----|-----------|----|----|----|----|----|----|----|----|----|----|----|----|--------------|-------------|---|---|-----|--------------------|---|---|---|---|--|
|                               | 27                       | 26            | 25 | 24         | 23 | 22        | 21 | 20 | 19 | 18 | 17 | 16 | 15 | 14 | 13 | 12 | 11 | 10 | 9            | 8           | 7 | 6 | 5   | 4                  | 3 | 2 | 1 | 0 |  |
| 11-bit row size configuration | Res.                     |               |    | Bank [1:0] |    | Row[10:0] |    |    |    |    |    |    |    |    |    |    |    |    |              | Column[7:0] |   |   |     | BM0 <sup>(3)</sup> |   |   |   |   |  |
|                               | Res.                     |               |    | Bank [1:0] |    | Row[10:0] |    |    |    |    |    |    |    |    |    |    |    |    |              | Column[8:0] |   |   |     | BM0                |   |   |   |   |  |
|                               | Res.                     |               |    | Bank [1:0] |    | Row[10:0] |    |    |    |    |    |    |    |    |    |    |    |    |              | Column[9:0] |   |   |     | BM0                |   |   |   |   |  |
|                               | Res.                     | Bank [1:0]    |    | Row[10:0]  |    |           |    |    |    |    |    |    |    |    |    |    |    |    | Column[10:0] |             |   |   | BM0 |                    |   |   |   |   |  |
| 12-bit row size configuration | Res.                     |               |    | Bank [1:0] |    | Row[11:0] |    |    |    |    |    |    |    |    |    |    |    |    |              | Column[7:0] |   |   |     | BM0                |   |   |   |   |  |
|                               | Res.                     |               |    | Bank [1:0] |    | Row[11:0] |    |    |    |    |    |    |    |    |    |    |    |    |              | Column[8:0] |   |   |     | BM0                |   |   |   |   |  |
|                               | Res.                     |               |    | Bank [1:0] |    | Row[11:0] |    |    |    |    |    |    |    |    |    |    |    |    |              | Column[9:0] |   |   |     | BM0                |   |   |   |   |  |
|                               | Res.                     | Bank [1:0]    |    | Row[11:0]  |    |           |    |    |    |    |    |    |    |    |    |    |    |    | Column[10:0] |             |   |   | BM0 |                    |   |   |   |   |  |
| 13-bit row size configuration | Res.                     |               |    | Bank [1:0] |    | Row[12:0] |    |    |    |    |    |    |    |    |    |    |    |    |              | Column[7:0] |   |   |     | BM0                |   |   |   |   |  |
|                               | Res.                     |               |    | Bank [1:0] |    | Row[12:0] |    |    |    |    |    |    |    |    |    |    |    |    |              | Column[8:0] |   |   |     | BM0                |   |   |   |   |  |
|                               | Res.                     |               |    | Bank [1:0] |    | Row[12:0] |    |    |    |    |    |    |    |    |    |    |    |    |              | Column[9:0] |   |   |     | BM0                |   |   |   |   |  |
|                               | Res.                     | Bank s. [1:0] |    | Row[12:0]  |    |           |    |    |    |    |    |    |    |    |    |    |    |    | Column[10:0] |             |   |   | BM0 |                    |   |   |   |   |  |

1. BANK[1:0] are the Bank Address BA[1:0]. When only 2 internal banks are used, BA1 must always be set to '0'.
2. Access to Reserved space (Res.) generates an AHB error.
3. BM0: is the byte mask for 16-bit access.

추가적으로 SDRAM Controller 특징에 대해서 살펴보도록 하자. SDRAM clock은 HCLK/2 혹은 HCLK/3이 되어야 한다고 명시되어 있다

## 37.7 SDRAM controller

### 37.7.1 SDRAM controller main features

The main features of the SDRAM controller are the following:

- Two SDRAM banks with independent configuration
- 8-bit, 16-bit, 32-bit data bus width
- 13-bits Address Row, 11-bits Address Column, 4 internal banks: 4x16Mx32bit (256 MB), 4x16Mx16bit (128 MB), 4x16Mx8bit (64 MB)
- Word, half-word, byte access
- SDRAM clock can be HCLK/2 or HCLK/3
  - Automatic row and bank boundary management
  - Multibank ping-pong access
  - Programmable timing parameters
  - Automatic Refresh operation with programmable Refresh rate
  - Self-refresh mode
  - Power-down mode
  - SDRAM power-up initialization by software
  - CAS latency of 1,2,3
  - Cacheable Read FIFO with depth of 6 lines x32-bit (6 x14-bit address tag)

그리고 SDRAM 메모리 인터페이스 시그널 관련 내용이다

### 37.7.2 SDRAM External memory interface signals

At startup, the SDRAM I/O pins used to interface the FMC SDRAM controller with the external SDRAM devices must be configured by the user application. The SDRAM controller I/O pins which are not used by the application, can be used for other purposes.

Table 296. SDRAM signals

| SDRAM signal | I/O type | Description                                                            | Alternate function |
|--------------|----------|------------------------------------------------------------------------|--------------------|
| SDCLK        | O        | SDRAM clock                                                            |                    |
| SDCKE[1:0]   | O        | SDCKE0: SDRAM Bank 1 Clock Enable<br>SDCKE1: SDRAM Bank 2 Clock Enable |                    |
| SDNE[1:0]    | O        | SDNE0: SDRAM Bank 1 Chip Enable<br>SDNE1: SDRAM Bank 2 Chip Enable     |                    |
| A[12:0]      | O        | Address                                                                | FMC_A[12:0]        |
| D[31:0]      | I/O      | Bidirectional data bus                                                 | FMC_D[31:0]        |
| BA[1:0]      | O        | Bank Address                                                           | FMC_A[15:14]       |
| NRAS         | O        | Row Address Strobe                                                     |                    |
| NCAS         | O        | Column Address Strobe                                                  |                    |
| SDNWE        | O        | Write Enable                                                           |                    |
| NBL[3:0]     | O        | Output Byte Mask for write accesses<br>(memory signal name: DQM[3:0])  | FMC_NBL[3:0]       |

현재 디스커버리 보드 회로도에는 SDRAM과 FMC가 연결된 것을 확인할 수 있다



|      |     |
|------|-----|
| PD14 | D0  |
| PD15 | D1  |
| PD0  | D2  |
| PD1  | D3  |
| PE7  | D4  |
| PE8  | D5  |
| PE9  | D6  |
| PE10 | D7  |
| PE11 | D8  |
| PE12 | D9  |
| PE13 | D10 |
| PE14 | D11 |
| PE15 | D12 |
| PD8  | D13 |
| PD9  | D14 |
| PD10 | D15 |
| PF0  | A0  |
| PF1  | A1  |
| PF2  | A2  |
| PF3  | A3  |
| PF4  | A4  |
| PF5  | A5  |
| PF12 | A6  |
| PF13 | A7  |
| PF14 | A8  |
| PF15 | A9  |
| PG0  | A10 |
| PG1  | A11 |

아래는 default 모드일 때 설정되는 FMC\_Data, FMC\_Address 핀들을 확인할 수 있다



그리고 SDRAM의 controller write cycle을 확인하도록 한다

### SDRAM controller write cycle

The SDRAM controller accepts single and burst write requests and translates them into single memory accesses. In both cases, the SDRAM controller keeps track of the active row for each bank to be able to perform consecutive write accesses to different banks (Multibank ping-pong access).

Before performing any write access, the SDRAM bank write protection must be disabled by clearing the WP bit in the FMC\_SDCRx register.

Figure 478. Burst write SDRAM access waveforms



Row 주소가 같고, column 주소가 다른 데이터를 연속으로 write하는 경우 burst mode로 동작한다. 순서는 row 주소를 먼저 NRAS 신호로 active를 시키고, NCAS로 column 주소를 바꿔가면서 active하게 된다. 그리고 column을 바꾸는 순간에 데이터도 하나씩 증가시키게 된다

주의할 것은 row를 active한 뒤 TRCD 혹은 TRCD + CAS 지연 시간 뒤에 write 명령이 실행되는 것을 볼 수 있다. TRCD는 Row에서 Column으로 넘어가는 지연 시간이라고 명시되어 있다. READ는 Cell에서 I/O 버퍼를 거쳐 Data가 출력되는데 시간이 필요하지만, WRITE 같은 경우에는 I/O 버퍼로 즉시 들어가기 때문에 별도에 시간이 필요하지 않다

#### Bits 27:24 TRCD[3:0]: Row to column delay

These bits define the delay between the Activate command and a Read/Write command in number of memory clock cycles.

0000: 1 cycle.

0001: 2 cycles

....

1111: 16 cycles

```

145
146     if(hsdrdram->State == HAL_SDRAM_STATE_RESET)
147     {
148         /* Allocate lock resource and initialize it */
149         hsdrdram->Lock = HAL_UNLOCKED;
150         /* Initialize the low level hardware (MSP) */
151         HAL_SDRAM_MspInit(hsdrdram);
152     }
153
154     /* Initialize the SDRAM controller state */
155     hsdrdram->State = HAL_SDRAM_STATE_BUSY;
156
157     /* Initialize SDRAM control Interface */
158     FMC_SDRAM_Init(hsdrdram->Instance, &(hsdrdram->Init));
159
160     /* Initialize SDRAM timing Interface */
161     FMC_SDRAM_Timing_Init(hsdrdram->Instance, Timing, hsdrdram->Init.SDBank);
162
163     /* Update the SDRAM controller state */
164     hsdrdram->State = HAL_SDRAM_STATE_READY;
165
166     return HAL_OK;
167 }
168

```

column에서 다음 row로 넘어갈 때도 똑같이 TRP와 TRCD 시간 딜레이가 포함되어 있다

Figure 482. Write access crossing row boundary



추가적으로 read는 지연시간에 CAS latency도 추가된다. CAS latency는 데이터가 읽히는 데까지의 지연 시간을 의미한다

Figure 479. Burst read SDRAM access



그리고 SDRAM 컨트롤러는 32bit 사이즈의 데이터를 6개 담을 수 있는 FIFO를 가지고 있다. 읽기 동작 시 지연시간동안 FIFO에는 읽을 데이터가 채워진다. 그리고 MCU에서 읽기를 시도하면 FIFO에서 데이터를 바로 출력하게 된다

2nd Read access : Requested data was previously stored in the FIFO



CubeMX에서 핀과 클럭을 설정하도록 한다. 기존 설정에 따라서 FMC와 RCC를 선택했다



IS42S16400J SDRAM 데이터 시트에 가면 -7 모델에서 133Mhz 이하를 CLK로 사용하면 CAS 지연을 2로 줄일 수 있다. 현재는 133Mhz 이하를 사용할 것이므로 CAS 지연은 2로 설정하도록 한다

### KEY TIMING PARAMETERS

| Parameter                     | -5  | -6  | <b>-7</b> | Unit |
|-------------------------------|-----|-----|-----------|------|
| <b>Clk Cycle Time</b>         |     |     |           |      |
| CAS Latency = 3               | 5   | 6   | 7         | ns   |
| CAS Latency = 2               | 7.5 | 7.5 | 7.5       | ns   |
| <b>Clk Frequency</b>          |     |     |           |      |
| CAS Latency = 3               | 200 | 166 | 143       | Mhz  |
| CAS Latency = 2               | 133 | 133 | 133       | Mhz  |
| <b>Access Time from Clock</b> |     |     |           |      |
| CAS Latency = 3               | 4.8 | 5.4 | 5.4       | ns   |
| CAS Latency = 2               | 5.4 | 5.4 | 5.4       | ns   |



CubeMX에서 CAS는 위와 같이 2 cycle로 하고, 클럭은 HCLK의 2분주를 하도록 할 것이다. 그리고 아래 나와있는 timing cycle은 아래 데이터시트 표에 맞춰서 값을 줄일 수도 있다. 현재는 동작에 중점을 둸고, default 값이 현재 클럭에 비해서 높은 대기 시간을 가지고 있어서 그대로 두도록 할 것이다.

#### AC ELECTRICAL CHARACTERISTICS (1,2,3)

| Symbol      | Parameter                                                                       | -5                                       |          | -6     |          | -7     |          | Units  |
|-------------|---------------------------------------------------------------------------------|------------------------------------------|----------|--------|----------|--------|----------|--------|
|             |                                                                                 | Min.                                     | Max.     | Min.   | Max.     | Min.   | Max.     |        |
| TCX3        | Clock Cycle Time                                                                | CAS Latency = 3                          | 5        | —      | 6        | —      | 7        | — ns   |
| TCX2        |                                                                                 | CAS Latency = 2                          | 7.5      | —      | 7.5      | —      | 7.5      | — ns   |
| TAC3        | Access Time From CLK <sup>(4,5)</sup>                                           | CAS Latency = 3                          | —        | 4.8    | —        | 5.4    | —        | 5.4 ns |
| TAC2        |                                                                                 | CAS Latency = 2                          | —        | 5.4    | —        | 5.4    | —        | 5.4 ns |
| tCH         | CLK HIGH Level Width                                                            | 2                                        | —        | 2      | —        | 2.5    | —        | ns     |
| tCL         | CLK LOW Level Width                                                             | 2                                        | —        | 2      | —        | 2.5    | —        | ns     |
| toh3        | Output Data Hold Time <sup>(6)</sup>                                            | CAS Latency = 3                          | 2.5      | —      | 2.5      | —      | 2.7      | — ns   |
| toh2        |                                                                                 | CAS Latency = 2                          | 2.5      | —      | 2.5      | —      | 2.7      | — ns   |
| tzl         | Output LOW Impedance Time                                                       | 0                                        | —        | 0      | —        | 0      | —        | ns     |
| thz3        | Output HIGH Impedance Time <sup>(5)</sup>                                       | CAS Latency = 3                          | —        | 4.8    | —        | 5.4    | —        | 5.4 ns |
| thz2        |                                                                                 | CAS Latency = 2                          | —        | 5.4    | —        | 5.4    | —        | 5.4 ns |
| tDS         | Input Data Setup Time                                                           | 1.5                                      | —        | 1.5    | —        | 1.5    | —        | ns     |
| tDH         | Input Data Hold Time                                                            | 0.8                                      | —        | 0.8    | —        | 0.8    | —        | ns     |
| tAS         | Address Setup Time                                                              | 1.5                                      | —        | 1.5    | —        | 1.5    | —        | ns     |
| tAH         | Address Hold Time                                                               | 0.8                                      | —        | 0.8    | —        | 0.8    | —        | ns     |
| TKS         | CKE Setup Time                                                                  | 1.5                                      | —        | 1.5    | —        | 1.5    | —        | ns     |
| TKH         | CKE Hold Time                                                                   | 0.8                                      | —        | 0.8    | —        | 0.8    | —        | ns     |
| TKA         | CKE to CLK Recovery Delay Time                                                  | 1CLK-3                                   | —        | 1CLK-3 | —        | 1CLK-3 | —        | ns     |
| TCMS        | Command Setup Time (CS, RAS, CAS, WE, DQM)                                      | 1.5                                      | —        | 1.5    | —        | 1.5    | —        | ns     |
| TCMH        | Command Hold Time (CS, RAS, CAS, WE, DQM)                                       | 0.8                                      | —        | 0.8    | —        | 0.8    | —        | ns     |
| TRC         | Command Period (REF / ACT to ACT)                                               | 55                                       | —        | 60     | —        | 63     | —        | ns     |
| TRAS        | Command Period (ACT to PRE)                                                     | 40                                       | 100,000  | 42     | 100,000  | 42     | 100,000  | ns     |
| TRP         | Command Period (PRE to ACT)                                                     | 15                                       | —        | 15     | —        | 15     | —        | ns     |
| TCRO        | Active Command To Read / Write Command Delay Time                               | 15                                       | —        | 15     | —        | 15     | —        | ns     |
| TRCD        | Command Period (ACT [0] to ACT[1])                                              | 10                                       | —        | 12     | —        | 14     | —        | ns     |
| TDPL or TWR | Input Data To Precharge<br>Command Delay time                                   | CAS Latency = 3                          | 2CLK     | —      | 2CLK     | —      | 2CLK     | — ns   |
|             |                                                                                 | CAS Latency = 2                          | 2CLK     | —      | 2CLK     | —      | 2CLK     | — ns   |
| TDAL        | Input Data To Active / Refresh<br>Command Delay time<br>(During Auto-Precharge) | CAS Latency = 3                          | 2CLK+trp | —      | 2CLK+trp | —      | 2CLK+trp | — ns   |
|             |                                                                                 | CAS Latency = 2                          | 2CLK+trp | —      | 2CLK+trp | —      | 2CLK+trp | — ns   |
| tr          | Transition Time                                                                 | 0.3                                      | 1.2      | 0.3    | 1.2      | 0.3    | 1.2      | ns     |
| tCSR        | Exit Self-Refresh to Active Time                                                | 60                                       | —        | 66     | —        | 70     | —        | ns     |
| tREF        | Refresh Cycle Time (4096)                                                       | T <sub>A</sub> ≤ 70°C Com., Ind., A1, A2 | —        | 64     | —        | 64     | —        | 64 ms  |
|             |                                                                                 | T <sub>A</sub> ≤ 85°C Ind., A1, A2       | —        | —      | —        | 64     | —        | 64 ms  |
|             |                                                                                 | T <sub>A</sub> > 85°C A2                 | —        | —      | —        | 16     | —        | 16 ms  |

그리고 코드를 생성하도록 할 것이다. 주의할 것은 FMC 초기화는 위와 같이 자동으로 설정되지만 SDRAM 동작은 초기화 과정을 거쳐야 한다. 데이터시트에는 이러한 절차를 명시하고 있다

### 37.7.3 SDRAM controller functional description

All SDRAM controller outputs (signals, address and data) change on the falling edge of the memory clock (FMC\_SDCLK).

#### SDRAM initialization

The initialization sequence is managed by software. If the two banks are used, the initialization sequence must be generated simultaneously to Bank 1 and Bank 2 by setting the Target Bank bits CTB1 and CTB2 in the FMC\_SDCMR register:

1. Program the memory device features into the FMC\_SDCRx register. The SDRAM clock frequency, RBURST and RPIPE must be programmed in the FMC\_SDCR1 register.
2. Program the memory device timing into the FMC\_SDTRx register. The TRP and TRC timings must be programmed in the FMC\_SDTR1 register.
3. Set MODE bits to '001' and configure the Target Bank bits (CTB1 and/or CTB2) in the FMC\_SDCMR register to start delivering the clock to the memory (SDCKE is driven high).
4. Wait during the prescribed delay period. Typical delay is around 100  $\mu$ s (refer to the SDRAM datasheet for the required delay after power-up).
5. Set MODE bits to '010' and configure the Target Bank bits (CTB1 and/or CTB2) in the FMC\_SDCMR register to issue a "Precharge All" command.
6. Set MODE bits to '011', and configure the Target Bank bits (CTB1 and/or CTB2) as well as the number of consecutive Auto-refresh commands (NRFS) in the FMC\_SDCMR register. Refer to the SDRAM datasheet for the number of Auto-refresh commands that should be issued. Typical number is 8.
7. Configure the MRD field according to your SDRAM device, set the MODE bits to '100', and configure the Target Bank bits (CTB1 and/or CTB2) in the FMC\_SDCMR register to issue a "Load Mode Register" command in order to program the SDRAM. In particular:
  - a) The CAS latency must be selected following configured value in FMC\_SDCR1/2 registers
  - b) The Burst Length (BL) of 1 must be selected by configuring the M[2:0] bits to 000 in the mode register (refer to the SDRAM datasheet). If the Mode Register is not the same for both SDRAM banks, this step has to be repeated twice, once for each bank, and the Target Bank bits set accordingly.
8. Program the refresh rate in the FMC\_SDRTR register  
The refresh rate corresponds to the delay between refresh cycles. Its value must be adapted to SDRAM devices.

대부분의 step은 예제 프로그램과 SDRAM에 맞춰진 latency 값을 바탕으로 적어 놓는다. 마지막 refresh는 SDRAM 클럭과 row size에 따라서 값이 달라진다

#### SDRAM Refresh Timer register (FMC\_SDRTR)

Address offset: 0x154

Reset value: 0x0000 0000

This register sets the refresh rate in number of SDCLK clock cycles between the refresh cycles by configuring the Refresh Timer Count value.

$$\text{Refresh rate} = (\text{SDRAM refresh rate} \times \text{SDRAM clock frequency}) - 20$$

$$\text{SDRAM refresh rate} = \text{SDRAM refresh period} / \text{Number of rows}$$

```

/* Step 8: Set the refresh rate counter */
/* (15.62 us x Freq) - 20 */
/* Set the device refresh counter */
// refresh rate = refresh period / number of rows
// refresh rate = 64ms / 4096 = 15.62us
// refresh count = (refresh rate x SDRAM clock frequency) - 20
// refresh count = 15.62us x 36MHz - 20 = 542.32
// Row Size = 12bit
// REFRESH_COUNT = 543

HAL_SDRAM_ProgramRefreshRate(hsdrdram, REFRESH_COUNT);

```

참고로 DRAM의 경우에는 캐퍼시터에 있는 전하가 방전하기 때문에 주기적으로 충전이 필요한데, 이 부분에서 REFRESH 동작이 필요한 것이다

이제 SDRAM에 데이터를 쓰고 읽으려고 한다. 현재 사용하려는 외부 뱅크는 2번으로 0xD0000000 ~ 0xFFFFFFF 주소 범위를 가지고 있다

Figure 457. FMC memory banks



MS30444V2

그런데 사용하는 SDRAM은 64Mbit이기 때문에 8Mbyte의 영역만 가지고 있다. 따라서 모든 영역을 사용할 수가 없다. 따라서 0xD0000000 ~ 0xD07FFFFF 영역만 사용이 가능하다

## 6.10 64-Mbit SDRAM (1Mbit x 16-bit x 4-bank)

The 64-Mbit SDRAM is a high-speed CMOS, dynamic random-access memory designed to operate in 3.3 V memory systems containing 67,108,864 bits. It is internally configured as a quad-bank DRAM with a synchronous interface. Each 16,777,216-bit bank is organized as 4,096 rows by 256 columns by 16 bits. The 64-Mbit SDRAM includes auto-refresh, power-saving, and power-down modes. All signals are registered on the positive edge of the clock signal, CLK.

The STM32F429ZIT6 reads and writes data at 80 MHz.

그래서 2Mbyte를 내부 4bank로 나눠서 해당 SDRAM을 사용할 수 있다

테스트 후 재 정리

<https://cafe.naver.com/stm32study>

FMC, SDRAM 참고

1. <https://blog.naver.com/mymissu/220447344061>
2. <https://m.blog.naver.com/specialist0/220966778735>

**Figure 7. DCMI slave AHB2 peripheral in STM32F407/417, STM32F427/437, STM32F429/439, STM32F446 and STM32F469/479 lines smart architecture**



1. For more information about SRAM1, SRAM2 and SRAM3, see [Table 3](#).

**Table 13. STM32F427xx and STM32F429xx register boundary addresses**

| Bus       | Boundary address          | Peripheral                     |
|-----------|---------------------------|--------------------------------|
|           | 0xE00F FFFF - 0xFFFF FFFF | Reserved                       |
| Cortex-M4 | 0xE000 0000 - 0xE00F FFFF | Cortex-M4 internal peripherals |
| AHB3      | 0xD000 0000 - 0xDFFF FFFF | FMC bank 6                     |
|           | 0xC000 0000 - 0xCFFF FFFF | FMC bank 5                     |
|           | 0xA000 1000 - 0xBFFF FFFF | Reserved                       |
|           | 0xA000 0000- 0xA000 0FFF  | FMC control register           |
|           | 0x9000 0000 - 0x9FFF FFFF | FMC bank 4                     |
|           | 0x8000 0000 - 0x8FFF FFFF | FMC bank 3                     |
|           | 0x7000 0000 - 0x7FFF FFFF | FMC bank 2                     |
|           | 0x6000 0000 - 0x6FFF FFFF | FMC bank 1                     |
|           | 0x5006 0C00- 0x5FFF FFFF  | Reserved                       |
| AHB2      | 0x5006 0800 - 0X5006 0BFF | RNG                            |
|           | 0x5005 0400 - X5006 07FF  | Reserved                       |
|           | 0x5005 0000 - 0X5005 03FF | DCMI                           |
|           | 0x5004 0000- 0x5004 FFFF  | Reserved                       |
|           | 0x5000 0000 - 0X5003 FFFF | USB OTG FS                     |

## 6.1 프로그램 개요

- 현재 MCU인 stm32f429에서의 카메라 제어 block은 다음과 같다. FMC를 사용하는 이유는 외부 메모리를 제어하기 위해서다. 그리고 SRAM이나 SDRAM에 데이터를 저장하고, parsing하는 것이 보다 빠르기 때문이다



- 빠른 데이터 저장을 위해 DMA 인터페이스를 사용하려고 한다. DMA2에

Table 43. DMA2 request mapping

| Peripheral requests | Stream 0               | Stream 1               | Stream 2                         | Stream 3               | Stream 4                          | Stream 5               | Stream 6                         | Stream 7                          |
|---------------------|------------------------|------------------------|----------------------------------|------------------------|-----------------------------------|------------------------|----------------------------------|-----------------------------------|
| Channel 0           | ADC1                   | SAI1_A <sup>(1)</sup>  | TIM8_CH1<br>TIM8_CH2<br>TIM8_CH3 | SAI1_A <sup>(1)</sup>  | ADC1                              | SAI1_B <sup>(1)</sup>  | TIM1_CH1<br>TIM1_CH2<br>TIM1_CH3 | -                                 |
| Channel 1           | -                      | DCMI                   | ADC2                             | ADC2                   | SAI1_B <sup>(1)</sup>             | SPI6_TX <sup>(1)</sup> | SPI6_RX <sup>(1)</sup>           | DCMI                              |
| Channel 2           | ADC3                   | ADC3                   | -                                | SPI5_RX <sup>(1)</sup> | SPI5_TX <sup>(1)</sup>            | CRYP_OUT               | CRYP_IN                          | HASH_IN                           |
| Channel 3           | SPI1_RX                | -                      | SPI1_RX                          | SPI1_TX                | -                                 | SPI1_TX                | -                                | -                                 |
| Channel 4           | SPI4_RX <sup>(1)</sup> | SPI4_TX <sup>(1)</sup> | USART1_RX                        | SDIO                   | -                                 | USART1_RX              | SDIO                             | USART1_TX                         |
| Channel 5           | -                      | USART6_RX              | USART6_RX                        | SPI4_RX <sup>(1)</sup> | SPI4_TX <sup>(1)</sup>            | -                      | USART6_TX                        | USART6_TX                         |
| Channel 6           | TIM1_TRIG              | TIM1_CH1               | TIM1_CH2                         | TIM1_CH1               | TIM1_CH4<br>TIM1_TRIG<br>TIM1_COM | TIM1_UP                | TIM1_CH3                         | -                                 |
| Channel 7           | -                      | TIM8_UP                | TIM8_CH1                         | TIM8_CH2               | TIM8_CH3                          | SPI5_RX <sup>(1)</sup> | SPI5_TX <sup>(1)</sup>           | TIM8_CH4<br>TIM8_TRIG<br>TIM8_COM |

1. These requests are available on STM32F42xxx and STM32F43xxx.

## 8-bit data

When EDM[1:0] in DCMI\_CR are programmed to “00” the interface captures 8 LSB’s at its input (D[0:7]) and stores them as 8-bit data. The D[13:8] inputs are ignored. In this case, to capture a 32-bit word, the camera interface takes four pixel clock cycles.

The first captured data byte is placed in the LSB position in the 32-bit word and the 4<sup>th</sup> captured data byte is placed in the MSB position in the 32-bit word. [Table 79](#) gives an example of the positioning of captured data bytes in two 32-bit words.

**Table 79. Positioning of captured data bytes in 32-bit words (8-bit width)**

| Byte address | 31:24                  | 23:16                  | 15:8                   | 7:0                    |
|--------------|------------------------|------------------------|------------------------|------------------------|
| 0            | D <sub>n+3</sub> [7:0] | D <sub>n+2</sub> [7:0] | D <sub>n+1</sub> [7:0] | D <sub>n</sub> [7:0]   |
| 4            | D <sub>n+7</sub> [7:0] | D <sub>n+6</sub> [7:0] | D <sub>n+5</sub> [7:0] | D <sub>n+4</sub> [7:0] |

### 6.3.27 Camera interface (DCMI) timing specifications

Unless otherwise specified, the parameters given in [Table 106](#) for DCMI are derived from tests performed under the ambient temperature, f<sub>HCLK</sub> frequency and V<sub>DD</sub> supply voltage summarized in [Table 17](#), with the following configuration:

- DCMI\_PIXCLK polarity: falling
- DCMI\_VSYNC and DCMI\_HSYNC polarity: high
- Data formats: 14 bits

**Table 106. DCMI characteristics**

| Symbol                                           | Parameter                                     | Min | Max | Unit |
|--------------------------------------------------|-----------------------------------------------|-----|-----|------|
|                                                  | Frequency ratio DCMI_PIXCLK/f <sub>HCLK</sub> | -   | 0.4 |      |
| DCMI_PIXCLK                                      | Pixel clock input                             | -   | 54  | MHz  |
| D <sub>Pixel</sub>                               | Pixel clock input duty cycle                  | 30  | 70  | %    |
| t <sub>su(DATA)</sub>                            | Data input setup time                         | 2   | -   | ns   |
| t <sub>h(DATA)</sub>                             | Data input hold time                          | 2.5 | -   |      |
| t <sub>su(HSYNC)</sub><br>t <sub>su(VSYNC)</sub> | DCMI_HSYNC/DCMI_VSYNC input setup time        | 0.5 | -   |      |
| t <sub>h(HSYNC)</sub><br>t <sub>h(VSYNC)</sub>   | DCMI_HSYNC/DCMI_VSYNC input hold time         | 1   | -   |      |

**Figure 75. DCMI timing diagram**

