我有一个示例AFP文件..要从中读取TLE(标签逻辑元素)以获取某些预定义标签,例如帐号或账单号,以便我可以将其转换为PDF以获取特定的账单号。也有用于执行相同操作的任何公共Java api。

最佳答案

TLE有两种不同类型:组级别和页面级别。组级别TLE出现在BNG(开始命名组)之后,而页面级TLE出现在页面的环境组(BPG)之后。 TLE本身使用两个三元组来承载元数据:FullyQualifiedName和AttributeValue。第一个包含键名,另一个包含值。

假设您的AFP格式正确,以下代码可帮助您从TLE中提取元数据:

import java.io.BufferedInputStream;
import java.io.FileInputStream;
import java.io.IOException;
import java.util.Optional;

import org.afplib.afplib.*;
import org.afplib.base.*;
import org.afplib.io.AfpInputStream;

public class DumpTLE {

public static void main(String[] args) {
    try (AfpInputStream in = new AfpInputStream(
            new BufferedInputStream(new FileInputStream(args[0])))) {

        int page = 0;
        int group = 0;
        boolean pageLevel = false;
        SF sf;
        while((sf = in.readStructuredField()) != null) {

            if(sf instanceof BPG) {
                page++;
                pageLevel = true;
            }
            if(sf instanceof EPG) {
                pageLevel = false;
            }
            if(sf instanceof BNG) {
                group++;
            }

            if(sf instanceof TLE) {
                TLE tle = (TLE) sf;

                Optional<FullyQualifiedName> fqn = tle.getTriplets().stream()
                        .filter(FullyQualifiedName.class::isInstance).map(FullyQualifiedName.class::cast)
                        .findFirst();
                Optional<AttributeValue> value = tle.getTriplets().stream()
                        .filter(AttributeValue.class::isInstance).map(AttributeValue.class::cast)
                        .findFirst();

                if(fqn.isPresent() && value.isPresent()) {
                    if(pageLevel) {
                        System.out.println("page "+page+" - "+fqn.get().getFQName()+":"+value.get().getAttVal());
                    } else {
                        System.out.println("group "+group+" - "+fqn.get().getFQName()+":"+value.get().getAttVal());
                    }
                }
            }
        }
    } catch (IOException e) {
        e.printStackTrace();
    }

}

}


该代码使用afplib(https://github.com/yan74/afplib)。将您的AFP转换为PDF是完全不同的事情,而不是那么容易。

关于java - 如何从AFP文件中提取元数据?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/42901792/

10-10 09:31