介紹由應用層所發出的 crypto(cryptography) request,透過 system call 將 request 傳送到 Linux kernel 端,並經由 crypto subsystem 將 request 轉發給硬體算法引擎 (hardware crypto engine) 的流程。
Overview
Crypto subsystem 是 Linux 系統中負責處理 crypto request 的子系統,除了包含流程控制機制之外,另一個重要特色就是提供演算法實作的抽象層,讓各家廠商能夠依據需求去客製化實作方式。其中一個常見例子就是廠商在硬體架構中加入用以加速特定演算法運算效率的硬體算法引擎,並且透過 crypto subsystem 將驅動硬體算法引擎的流程整合進 Linux 系統中,供其他 kernel module 或是應用層使用。
以下以 openSSL library 如何將 crypto request 傳送到 kernel crypto subsystem 為例子:
image from: Linux Kernel 密碼學演算法實作流程
cryptodev
Engine
在 Linux 系統中,想要實現應用層與硬體裝置的溝通,第一個想到的就是透過 character/block device driver,讓應用程式開啟表示此硬體裝置的抽象檔案,並且藉由讀寫行為與硬體裝置進行互動。而 Cryptodev-linux 就是負責此角色,它提供中間層的服務,接收由應用層傳送過來的 crypto request,再呼叫 Linux kernel crypto Subsystem 的 crypto API 將 request 轉發給特定的硬體算法引擎。
Cryptodev-linux 為 miscellaneous device 類型的 kernel module,預設路徑是 /dev/crypto
,使用 ioctl file operation cryptodev_ioctl
來接受應用端所傳遞過來的資料。
1// https://github.com/cryptodev-linux/cryptodev-linux/blob/master/ioctl.c
2
3static const struct file_operations cryptodev_fops = {
4 .owner = THIS_MODULE,
5 .open = cryptodev_open,
6 .release = cryptodev_release,
7 .unlocked_ioctl = cryptodev_ioctl,
8#ifdef CONFIG_COMPAT
9 .compat_ioctl = cryptodev_compat_ioctl,
10#endif /* CONFIG_COMPAT */
11 .poll = cryptodev_poll,
12};
13
14static struct miscdevice cryptodev = {
15 .minor = MISC_DYNAMIC_MINOR,
16 .name = "crypto",
17 .fops = &cryptodev_fops,
18 .mode = S_IRUSR|S_IWUSR|S_IRGRP|S_IWGRP|S_IROTH|S_IWOTH,
19};
20
21static int __init
22cryptodev_register(void)
23{
24 int rc;
25
26 rc = misc_register(&cryptodev);
27 if (unlikely(rc)) {
28 pr_err(PFX "registration of /dev/crypto failed\n");
29 return rc;
30 }
31
32 return 0;
33}
應用端則是使用 cryptodev.h
定義好的 struct crypt_op
或是 struct crypt_auth_op
來組成指定 crypto request,並呼叫 ioctl system call 將 request 送給 Cryptodev-linux。
1// https://github.com/cryptodev-linux/cryptodev-linux/blob/master/crypto/cryptodev.h
2
3struct crypt_auth_op {
4 __u32 ses; /* session identifier */
5 __u16 op; /* COP_ENCRYPT or COP_DECRYPT */
6 __u16 flags; /* see COP_FLAG_AEAD_* */
7 __u32 len; /* length of source data */
8 __u32 auth_len; /* length of auth data */
9 __u8 __user *auth_src; /* authenticated-only data */
10
11 /* The current implementation is more efficient if data are
12 * encrypted in-place (src==dst). */
13 __u8 __user *src; /* data to be encrypted and authenticated */
14 __u8 __user *dst; /* pointer to output data. Must have
15 * space for tag. For TLS this should be at least
16 * len + tag_size + block_size for padding */
17
18 __u8 __user *tag; /* where the tag will be copied to. TLS mode
19 * doesn't use that as tag is copied to dst.
20 * SRTP mode copies tag there. */
21 __u32 tag_len; /* the length of the tag. Use zero for digest size or max tag. */
22
23 /* initialization vector for encryption operations */
24 __u8 __user *iv;
25 __u32 iv_len;
26};
Sample code for Cryptodev-linux ioctl:
1// setup data for your crypto request
2cryp.ses = ctx->sess.ses;
3cryp.iv = (void*)iv;
4cryp.op = COP_DECRYPT;
5cryp.auth_len = auth_size;
6cryp.auth_src = (void*)auth;
7cryp.len = size;
8cryp.src = (void*)ciphertext;
9cryp.dst = ciphertext;
10cryp.flags = COP_FLAG_AEAD_TLS_TYPE;
11
12// call ioctl to pass a crypto request to `/dev/crypto`
13if (ioctl(ctx->cfd, CIOCAUTHCRYPT, &cryp)) {
14 perror("ioctl(CIOCAUTHCRYPT)");
15 return -1;
16}
另外,Cryptodev-linux 也提供 session 機制,每個 crypto request 對應到一個 session,而 session 管理當前 crypto request 的狀態。例如,目前 session 在 initialized 的狀態,則表示此 crypto request 可執行 encrypt,透過此方式來確保 crypto request 會在正確的流程下運作。
Linux Kernel Crypto Subsystem
Crypto request 會透過 kernel crypto API 傳到 kernel crypto subsystem 中。以下為簡略的 crypto API 呼叫流程:
Transformation Object & Transformation Implementation
首先 Crypto subsystem 有兩個重要元素:transformation object 和 transformation implementation。
transformation object 在 API 中會簡寫為 tfm
,又被稱作 cipher handler;而 transformation implementation 則是 transformation object 底層的實作內容,又被稱作 crypto algo,以之前例子來說就是 crypto engine 的演算法實作。之所以要區分成 object 和 implementation,最主要的原因是有可能多個 object 會使用同一個 implementation。舉例來說,A 和 B 使用者都要使用 hmac-sha256 算法,因此會新建立 A 和 B 兩個 transformation object 並包含 A 和 B 各自擁有的 key 值,但這兩個 object 有可能會使用同一個 transformation implementation 來呼叫同一個 crypto engine 進行算法運算。
TFM: The transformation object (TFM) is an instance of a transformation implementation. There can be multiple transformation objects associated with a single transformation implementation. Each of those transformation objects is held by a crypto API consumer or another transformation. https://www.kernel.org/doc/html/latest/crypto/intro.html
1struct crypto_tfm {
2 u32 crt_flags;
3 int node;
4 void (*exit)(struct crypto_tfm *tfm);
5 struct crypto_alg *__crt_alg; // crypto algorithm or transformation implementation
6 void *__crt_ctx[] CRYPTO_MINALIGN_ATTR;
7};
當有 crypto request 進來,會先根據 request 中指定的算法名稱,從已註冊的 crypto algorithm list 中取出適合的 crypto algorithm,並新建立 transformation object。之後, transformation object 會再被組成 crypto subsystem 所用的 cipher request。cipher request 有可能共用同一個 transformation object,舉例來說,hmac-sha256 的 transformation object 包含了 transformation implementation 和一個 key 值,而這個 transformation object 可以使用在多個 cipher request 的 messsage 上進行 hash 算法 (不同 plaintext 使用同一把 key 進行運算)。
當 cipher request 完成相關設值之後,接著實際呼叫 transformation object 的 transformation implementation 執行演算法運算。
此時會出現一個問題,就是當短時間有多個 request 進來時,我們該如何依序地處理 request?這點 crypto subsystem 也設計了方便的 struct crypto_engine
,crypto engine 提供了 queue 管理機制,讓多個 request 能夠順序地轉發給對應的 crypto engine。當然如果我們有額外的需求,也可以自己實作其他機制來管理,不一定要使用 crypto engine。
1struct crypto_engine {
2 char name[ENGINE_NAME_LEN];
3 bool idling;
4 bool busy;
5 bool running;
6
7 bool retry_support;
8
9 struct list_head list;
10 spinlock_t queue_lock;
11 struct crypto_queue queue;
12 struct device *dev;
13
14 bool rt;
15
16 // implement these three functions to trigger your hardware crypto engine
17 int (*prepare_crypt_hardware)(struct crypto_engine *engine);
18 int (*unprepare_crypt_hardware)(struct crypto_engine *engine);
19 int (*do_batch_requests)(struct crypto_engine *engine);
20
21 struct kthread_worker *kworker;
22 struct kthread_work pump_requests;
23
24 void *priv_data;
25 struct crypto_async_request *cur_req;
26};
Register an Crypto Algorithm (Transformation Implementation)
介紹完 crypt API 流程後,可以知道要新增 transformation implementation 到 crypto subsystem,最重要的就是註冊 transformation implementation 到 crypto algorithm list 中。而 Crypto API 提供了相關註冊 API,以 stm32-cryp 為例:
1struct skcipher_alg {
2 int (*setkey)(struct crypto_skcipher *tfm, const u8 *key,
3 unsigned int keylen);
4 int (*encrypt)(struct skcipher_request *req);
5 int (*decrypt)(struct skcipher_request *req);
6 int (*init)(struct crypto_skcipher *tfm);
7 void (*exit)(struct crypto_skcipher *tfm);
8
9 unsigned int min_keysize;
10 unsigned int max_keysize;
11 unsigned int ivsize;
12 unsigned int chunksize;
13 unsigned int walksize;
14
15 struct crypto_alg base;
16};
17
18static struct skcipher_alg crypto_algs[] = {
19{
20 .base.cra_name = "ecb(aes)",
21 .base.cra_driver_name = "stm32-ecb-aes",
22 .base.cra_priority = 200,
23 .base.cra_flags = CRYPTO_ALG_ASYNC,
24 .base.cra_blocksize = AES_BLOCK_SIZE,
25 .base.cra_ctxsize = sizeof(struct stm32_cryp_ctx),
26 .base.cra_alignmask = 0xf,
27 .base.cra_module = THIS_MODULE,
28
29 .init = stm32_cryp_init_tfm,
30 .min_keysize = AES_MIN_KEY_SIZE,
31 .max_keysize = AES_MAX_KEY_SIZE,
32 .setkey = stm32_cryp_aes_setkey,
33 .encrypt = stm32_cryp_aes_ecb_encrypt,
34 .decrypt = stm32_cryp_aes_ecb_decrypt,
35},
36}
上述建立含有演算法實作的 transformation implementation 後,接著呼叫註冊 API:
1ret = crypto_register_skciphers(crypto_algs, ARRAY_SIZE(crypto_algs));
2if (ret) {
3 dev_err(dev, "Could not register algs\n");
4 goto err_algs;
5}
即可完成註冊。
另外,上面提及的 structure member 中, cra_priority
代表各 transformation implementation 的優先程度,舉例來說,AES-ECB 有註冊軟體和硬體兩種不同的 transformation implementation,優先程度較高的會先被採用。
cra_priority
- Priority of this transformation implementation. In case multiple transformations with same cra_name are available to the Crypto API, the kernel will use the one with highest cra_priority.