概述
MLIR Toy Tutorial 的目標(biāo)是通過(guò)構(gòu)建一門編程語(yǔ)言編譯器的完整過(guò)程(包括前端和后端技術(shù)),教授如何使用 MLIR 的各個(gè)組件來(lái)實(shí)現(xiàn)語(yǔ)言的解析、轉(zhuǎn)換和代碼生成等功能蹋砚。
終于來(lái)到了 codegen 這章奏瞬,它介紹了如何將 Chapter 5 生成的 low-level IR lowering 成 LLVM IR,并通過(guò) JIT 的方式來(lái)解釋執(zhí)行樣例代碼。
Full Lowering
applyFullConversion(module, target, patterns)
用于執(zhí)行完整的、全局性的轉(zhuǎn)換,目標(biāo)是將方言的所有操作都完全轉(zhuǎn)換為目標(biāo)方言的等效操作抵代。和 partial lowering 一樣,它需要在 target
定義目標(biāo) IR -- LLVM忘嫉,然后還要提供一套能生成 LLVM IR 的 rewrite patterns -- patterns
荤牍。
Chapter 5 通過(guò) partial lowering 已經(jīng)將除 toy.print
以外的 IR 都 lowering 成了 affine
,arith
和 std
built-in IR庆冕,MLIR 提供有現(xiàn)成的 rewrite patterns 就可以很容易滴將它們轉(zhuǎn)換成 LLVM IR:
mlir::RewritePatternSet patterns(&getContext());
mlir::populateAffineToStdConversionPatterns(patterns, &getContext());
mlir::cf::populateSCFToControlFlowConversionPatterns(patterns, &getContext());
mlir::arith::populateArithToLLVMConversionPatterns(typeConverter,
patterns);
mlir::populateFuncToLLVMConversionPatterns(typeConverter, patterns);
mlir::cf::populateControlFlowToLLVMConversionPatterns(patterns, &getContext());
// The only remaining operation, to lower from the `toy` dialect, is the
// PrintOp.
patterns.add<PrintOpLowering>(&getContext());
唯一需要自己寫轉(zhuǎn)換規(guī)則的 op 就是 toy.print康吵。PrintOpLowering
會(huì)創(chuàng)建 malloc、printf 符號(hào)访递,將 mlir.memref
數(shù)據(jù)類型的輸入數(shù)據(jù)寫入 malloc 得到的 buffer晦嵌,再通過(guò) printf 把 buffer 打印出來(lái),對(duì)于 CPU 來(lái)說(shuō)拷姿,在編譯時(shí) printf惭载、malloc 會(huì)鏈接到 libc 中相應(yīng)的庫(kù)函數(shù):
module {
llvm.func @free(!llvm.ptr)
llvm.mlir.global internal constant @nl("\0A\00") {addr_space = 0 : i32}
llvm.mlir.global internal constant @frmt_spec("%f \00") {addr_space = 0 : i32}
llvm.func @printf(!llvm.ptr<i8>, ...) -> i32
llvm.func @malloc(i64) -> !llvm.ptr
llvm.func @main() {
%0 = llvm.mlir.constant(4.000000e+00 : f64) : f64
%1 = llvm.mlir.constant(1.000000e+00 : f64) : f64
...
%8 = llvm.call @malloc(%7) : (i64) -> !llvm.ptr
%9 = llvm.mlir.undef : !llvm.struct<(ptr, ptr, i64, array<2 x i64>, array<2 x i64>)>
%10 = llvm.insertvalue %8, %9[0] : !llvm.struct<(ptr, ptr, i64, array<2 x i64>, array<2 x i64>)>
%11 = llvm.insertvalue %8, %10[1] : !llvm.struct<(ptr, ptr, i64, array<2 x i64>, array<2 x i64>)>
...
%48 = llvm.call @printf(%30, %47) : (!llvm.ptr<i8>, f64) -> i32
...
llvm.call @free(%52) : (!llvm.ptr) -> ()
llvm.return
}
}
CodeGen: Run JIT
前面幾章的內(nèi)容只是把 IR 打印出來(lái),卻從來(lái)沒有運(yùn)行過(guò)它們响巢。通過(guò) mlir::ExecutionEngine
可以創(chuàng)建MLIR JIT 執(zhí)行引擎描滔,engine->invoke("main")
會(huì)先編譯 main 函數(shù)然后再執(zhí)行:
int runJit(mlir::ModuleOp module) {
// Initialize LLVM targets.
llvm::InitializeNativeTarget();
llvm::InitializeNativeTargetAsmPrinter();
// An optimization pipeline to use within the execution engine.
auto optPipeline = mlir::makeOptimizingTransformer(
/*optLevel=*/EnableOpt ? 3 : 0, /*sizeLevel=*/0,
/*targetMachine=*/nullptr);
// Create an MLIR execution engine. The execution engine eagerly JIT-compiles
// the module.
auto maybeEngine = mlir::ExecutionEngine::create(module,
/*llvmModuleBuilder=*/nullptr, optPipeline);
assert(maybeEngine && "failed to construct an execution engine");
auto &engine = maybeEngine.get();
// Invoke the JIT-compiled function.
auto invocationResult = engine->invoke("main");
if (invocationResult) {
llvm::errs() << "JIT invocation failed\n";
return -1;
}
return 0;
}
總結(jié)
文章介紹了如何使用 applyFullConversion 執(zhí)行全局轉(zhuǎn)換,生成 LLVM IR踪古,以及 JIT 引擎的創(chuàng)建和調(diào)用含长。